Comment trier une liste de blogs selon leur indice de popularité Technorati? ¿Cómo ordenar una lista de los blogs según el índice de popularidad de Technorati?
Dans le En el précédent article Artículo Anterior , nous avons appris à nous servir du logiciel gratuit XScrape , qui permet d'extraire des données du web. Hemos aprendido a utilizar el software libre XScrape, que permite extraer datos de la web. Nous allons l'utiliser aujourd'hui dans un exemple pratique : le triage d'une liste de blogs selon leur indice Technorati. Ahora vamos a utilizar un ejemplo práctico: ordenar una lista de blogs según el índice de Technorati.
L'indice de popularité d'un blog, au sens de Technorati, correspond au nombre de blogs différents qui lient vers ce blog. El índice de popularidad de un blog, en el sentido de Technorati, es el número de diferentes blogs que tienen enlaces a este blog. Ce n'est pas forcément un indice de qualité mais un indicateur de l' influence du blog dans la blogosphère, qui peut être lié aussi aux capacités de l'auteur à promouvoir son blog. Esto no es necesariamente una indicación de calidad, sino un indicador de la influencia de los blogs en la blogosfera, que también puede estar vinculada a la capacidad del autor para promover su blog. Il est donc logique de s'y intéresser afin d'étudier les méthodes des blogueurs qui ont réussi à faire leur trou. Por tanto, es lógico estar interesado en estudiar los métodos de los bloggers que han logrado hacer sus madrigueras.
Pour consulter l'indice de Technorati d'un blog, rien de plus simple : il suffit de consulter la page http://www.technorati.com/blogs/{adresse_du_blog_voulu}. Para ver el índice de blogs Technorati, nada más sencillo: basta con visitar el http://www.technorati.com/blogs/ adresse_du_blog_voulu (). En conséquence, il semble aisé d'automatiser la récupération de l'indice de Technorati de plusieurs blogs grâce à XScrape. Por lo tanto, parece fácil de automatizar el índice de recuperación de Technorati para los blogs con XScrape.
Afin de rendre notre entreprise intéressante, nous allons nous pencher sur la Para hacer que nuestra compañía atractiva, vamos a considerar la liste de blogs de développement personnel lista de blogs de desarrollo personal de Priscilla Palmer (eh oui, je ne m'en lasse pas;). Priscilla Palmer (sí, estoy cansado;). Le triage de la liste de Priscilla se déroulera en 4 phases distinctes : Ordenar la lista por Priscila se llevará a cabo en 4 fases:
- Récupération automatique des liens des blogs de la page de Priscilla Palmer Enlaces a los blogs de Autorrecuperación página Priscilla Palmer
- Transformation de ces liens en liens Technorati Transformación de estos enlaces en los enlaces de Technorati
- Récupération automatique des indices Technorati de tous les blogs Autorrecuperación índices Technorati todos los blogs
- Triage des informations obtenues Clasificación de información obtenida
Récupération automatique des liens des blogs de la page de Priscilla Palmer Enlaces a los blogs de Autorrecuperación página Priscilla Palmer
Pour récupérer les liens des blogs de la liste de Priscilla Palmer, il suffit d'exécuter XScrape avec les paramètres suivants : Para recuperar los vínculos de la lista de los blogs por Priscilla Palmer, tan sólo ejecute XScrape con los siguientes parámetros:
URL : http://priscillapalmer.com/pdl.php/ URL: http://priscillapalmer.com/pdl.php/
Inclusive URLs : http://priscillapalmer.com/pdl.php/ URL de la inclusión: http://priscillapalmer.com/pdl.php/
Exclusive URLs : http://priscillapalmer.com/,http://www.priscillapalmer.com/ URL exclusiva: http://priscillapalmer.com/, http://www.priscillapalmer.com/
Regular Expression : <a[^<>]*href=”http[^<>]*target=”_blank”[^<>]*>[^<>]*</a> Expresión regular: <a href = [^<>]* "http [^<>]* target =" _blank "[^<>]*>[^<>]*</ a>
Une rapide analyse de la page de Priscilla permet en effet de voir que tous les liens des blogs listés possèdent l'attribut target=”_blank”, ce qui permet de récupérer automatiquement les bons liens. Un rápido análisis de la página Priscilla usted realmente ver que todos los blogs que figuran enlaces tienen el atributo TARGET = "_blank", que recupera automáticamente las conexiones correctas.
Transformation de ces liens en liens Technorati Transformación de estos enlaces en los enlaces de Technorati
Après avoir récupéré le résultat de XScrape dans un fichier texte, une simple opération de remplacement suffit à obtenir les liens Technorati : Después de conseguir el XScrape resultado en un archivo de texto, una operación de simple sustitución, sólo para obtener los enlaces de Technorati:
- Remplacer http:// par : http://www.technorati.com/blogs/ Reemplazar http:// con: http://www.technorati.com/blogs/
Pour l'instant, je n'ai pas encore trouvé le moyen d'analyser une page html sans utiliser une adresse http. Por ahora, todavía no he encontrado una manera de analizar una página html sin necesidad de utilizar una dirección HTTP. J'ai donc mis cette page sur mon serveur local pour que XScrape puisse trouver le fichier. Así que puse esta página en mi servidor local para XScrape puede encontrar el archivo. Cela donne une adresse du genre http://localhost/ … Esto da una dirección del tipo http://localhost/ ...
Récupération automatique des indices Technorati de tous les blogs Autorrecuperación índices Technorati todos los blogs
Pour récupérer les indices de technorati des blogs de la liste de Priscilla Palmer, il suffit d'exécuter XScrape avec les paramètres suivants : Para recuperar el índice de blogs Technorati lista de Priscilla Palmer, tan sólo ejecute XScrape con los siguientes parámetros:
URL : http://localhost/lienstechnorati.html (la page qu'on a construit à l'étape précédente) URL: http://localhost/lienstechnorati.html (la página que fue construido en el paso anterior)
Inclusive URLs : http://www.technorati.com/blogs/ URL de la inclusión: http://www.technorati.com/blogs/
Exclusive URLs : http://www.technorati.com/blogs/tag/ URL exclusiva: http://www.technorati.com/blogs/tag/
Regular Expression : <a[^<>]*class=”links”[^<>]*href=”/search/[^<>]*title=”View[^<>]*blog[^<>]*reactions”>Authority: [^<>]*</a>[^<>]*</div>[^<>]*<div>[^<>]*<a[^<>]*class=”fav Expresión regular: <a class = [^<>]* "vínculos "[^<>]* href =" / search /[^<>]* title = "Ver [^<>]* blog [^<>] * reacciones "> Authority: [^<>]*</ ha >[^<>]*</ div >[^<>]*< div >[^<>]*< ha [^<>]* clase = "fav
Pour trouver la bonne expression régulière, il faut consulter le code source d'une page de blog Technorati. Para encontrar la expresión regular correcta, debe consultar el código fuente de una página de blog Technorati. Ensuite en tatônnant un peu, on obtient finalement la bonne expression régulière. Entonces, buscando a tientas un poco, finalmente obtener la expresión regular adecuada.
Notons que cette méthode m'a permi de récupérer environ 80% des indices technorati, et ceci pour 3 raisons : Tenga en cuenta que este método me ha permitido recuperar en torno al 80% de los índices de Technorati, y esto por 3 razones:
1/Certains liens ne correspondaient pas à la racine du blog Enlaces 1/Certains no corresponden a la raíz del blog
2/Certains liens n'ont pas encore d'indice car personne n'a encore lié à leur blog Relación 2/Certains no índice porque nadie ha vinculado a su blog
3/Certains liens ne sont pas des blogs Enlaces 3/Certains no son blogs
Triage des informations obtenues Clasificación de información obtenida
Avec un peu d' Con un poco de excel Excel et un peu d' y algunos de los autohotkey AutoHotkey , on peut faire des merveilles. , Puede hacer maravillas.
Voici comment j'ai procédé : He aquí cómo procedió:
- J'ai d'abord supprimé dans la sortie obtenue toutes les données inutiles En primer lugar, borrará todos los datos de salida que resulta inútil
-
Puis j'ai transformé le fichier en format CSV par des remplacements successifs pour obtenir des lignes où les colonnes sont séparées par des points virgule, pour pouvoir l'importer dans Excel : Luego cambié el archivo en formato CSV por sustituciones sucesivas de las filas en las columnas están separadas por punto y coma, para poder importarlo en Excel:
http://www.threesixtyalliance.com/360-view;6 http://www.threesixtyalliance.com/360-view 6;
http://www.todayisthatday.com/blog;314 http://www.todayisthatday.com/blog; 314
http://www.positiveselftalkguide.com;46 http://www.positiveselftalkguide.com, 46
etc. etc.
- Pour connaître les blogs dont on n'a pas pu avoir l'indice, il est intéressant aussi d'importer les données de la liste obtenue lors de l'étape 1 dans le même fichier excel afin de faire une comparaison. Para encontrar los blogs que no podía tomar el índice, también es interesante para la importación de datos de lista obtenido en el paso 1 en el mismo Excel para hacer una comparación.
-
Grâce à un A través de una script script autohotkey, on peut ensuite facilement faire correspondre les colonnes et obtenir un résultat de ce genre : AutoHotkey, puede fácilmente coincidir con las columnas y obtener un resultado como este:
(il ya en tout 727 lignes) (hay un total de 727 líneas)
- On peut ensuite trier les lignes et exporter toutes ces données dans un fichier HTML pour obtenir la liste finale. Entonces podemos ordenar las filas y exportar todos estos datos en un archivo HTML para la lista final.
Conclusion Conclusión
J'espère que grâce à cet article, vous aurez pu découvrir la puissance de XScrape. Espero que a través de este artículo, se le han descubierto el poder de XScrape. On remarquera qu'il est possible de faire la même chose en utilisant l'API de Technorati, mais la méthode présentée ici a l'avantage de ne nécessiter aucune connaissance en programmation. Tenga en cuenta que es posible hacer lo mismo usando la API de Technorati, pero el método presentado aquí tiene la ventaja de no requerir ningún conocimiento de programación.
Dans le prochain article, vous trouverez la liste complète des blogs de développement personnel de Priscilla Palmer triés selon leur indice Technorati. En la siguiente sección, usted encontrará la lista completa de desarrollo personal blogs Priscilla Palmer ordenados según su índice de Technorati.
Tags: Etiquetas: autohotkey AutoHotkey , , blog blog , , Développement Personnel Desarrollo Personal , , Excel Excel , , expression régulière expresión regular , , liste lista , , parseur analizador , , popularité Popularidad , , regular expression expresión regular , , technorati Technorati , , tutoriel Tutorial , , xscrape xscrape
Articles similaires (en théorie) : Al igual que (en teoría):
Il ya un an sur C'éclair! Hace un año en este hilo! - mars 2008 - Marzo de 2008
Stats Estadísticas
XScrape : un logiciel gratuit pour extraire des données à partir du web XScrape: un programa gratuito para extraer datos de la web
Page de stats : où trouver les meilleurs scripts de statistiques Página de estadísticas: dónde encontrar las mejores estadísticas de las secuencias de comandos
Il ya un an sur C'éclair! Hace un año en este hilo! - février 2008 - Febrero de 2008









Jean Michel Jean Michel said, dicho,
Wrote on Escribió el mars 10, 2008 @ 20:05 10 de marzo 2008 @ 20:05
Un tuto bien expliqué Un tutorial bien explicado
beau travail buen trabajo
Bonne fin de journée:) Buen final de día:)
Wojciech Wojciech said, dicho,
Wrote on Escribió el mars 28, 2009 @ 0:56 28 de marzo 2009 @ 0:56
Hello admin. Hola admin. Very good web site, great work and thank you for your service. Muy buen sitio web, un gran trabajo y gracias por su servicio. for Youre a genius! para Eres un genio! spring, Thank you for your site primavera, Gracias por su sitio