Comment trier une liste de blogs selon leur indice de popularité Technorati? Wie man eine Liste von Blogs nach Technorati Popularitätsindex sortieren?

Dans le In der précédent article Vorige Artikel , nous avons appris à nous servir du logiciel gratuit XScrape , qui permet d'extraire des données du web. Wir haben gelernt, nutzen Sie die kostenlose Software XScrape, die auf dem Web-Daten zu extrahieren. Nous allons l'utiliser aujourd'hui dans un exemple pratique : le triage d'une liste de blogs selon leur indice Technorati. Wir werden nun ein praktisches Beispiel: Sortieren einer Liste von Blogs nach Technorati Index.

L'indice de popularité d'un blog, au sens de Technorati, correspond au nombre de blogs différents qui lient vers ce blog. Der Index der Popularität eines Blogs im Sinne von Technorati, ist die Anzahl der verschiedenen Blogs, die Verbindung zu diesem Blog. Ce n'est pas forcément un indice de qualité mais un indicateur de l' influence du blog dans la blogosphère, qui peut être lié aussi aux capacités de l'auteur à promouvoir son blog. Dies ist nicht unbedingt ein Zeichen von Qualität, sondern ein Indikator für den Einfluss der Blog in der Blogosphäre, die auch die Fähigkeit des Autors verknüpft werden können, um seinem Blog zu fördern. Il est donc logique de s'y intéresser afin d'étudier les méthodes des blogueurs qui ont réussi à faire leur trou. Es ist daher logisch, dass sein Interesse an Methoden der Blogger, die es geschafft, ihre Höhlen zu haben zu studieren.

Pour consulter l'indice de Technorati d'un blog, rien de plus simple : il suffit de consulter la page http://www.technorati.com/blogs/{adresse_du_blog_voulu}. Um den Index von Technorati Blogs, nichts einfacher als das: Rufen Sie einfach die http://www.technorati.com/blogs/ adresse_du_blog_voulu (). En conséquence, il semble aisé d'automatiser la récupération de l'indice de Technorati de plusieurs blogs grâce à XScrape. Daher scheint es leicht, die Verwertung Index Technorati für Blogs mit XScrape automatisieren.

Afin de rendre notre entreprise intéressante, nous allons nous pencher sur la Um unser Unternehmen attraktiv, betrachten wir die liste de blogs de développement personnel Liste der persönlichen Entwicklung Blogs de Priscilla Palmer (eh oui, je ne m'en lasse pas;). Priscilla Palmer (ja, ich bin müde;). Le triage de la liste de Priscilla se déroulera en 4 phases distinctes : Sortieren der Liste von Priscilla wird in 4 Phasen durchgeführt werden:

  1. Récupération automatique des liens des blogs de la page de Priscilla Palmer AutoWiederherstellen Links zu den Blogs Seite Priscilla Palmer
  2. Transformation de ces liens en liens Technorati Transformation dieser links in Technorati Links
  3. Récupération automatique des indices Technorati de tous les blogs AutoWiederherstellen Technorati indiziert alle Blogs
  4. Triage des informations obtenues Sortierung gewonnenen Informationen

Récupération automatique des liens des blogs de la page de Priscilla Palmer AutoWiederherstellen Links zu den Blogs Seite Priscilla Palmer

Pour récupérer les liens des blogs de la liste de Priscilla Palmer, il suffit d'exécuter XScrape avec les paramètres suivants : Um die Links von Blogs abzurufen Liste von Priscilla Palmer, führen Sie einfach XScrape mit den folgenden Parametern:

URL : http://priscillapalmer.com/pdl.php/ URL: http://priscillapalmer.com/pdl.php/

Inclusive URLs : http://priscillapalmer.com/pdl.php/ Inclusive URLs: http://priscillapalmer.com/pdl.php/

Exclusive URLs : http://priscillapalmer.com/,http://www.priscillapalmer.com/ Exklusive URLs: http://priscillapalmer.com/, http://www.priscillapalmer.com/

Regular Expression : <a[^<>]*href=”http[^<>]*target=”_blank”[^<>]*>[^<>]*</a> Regular Expression: <a href = [^<>]* "http [^<>]* target =" _blank "[^<>]*>[^<>]*</ a>

Une rapide analyse de la page de Priscilla permet en effet de voir que tous les liens des blogs listés possèdent l'attribut target=”_blank”, ce qui permet de récupérer automatiquement les bons liens. Eine kurze Analyse von Priscilla Seite finden Sie tatsächlich sehen, dass alle Blogs aufgeführten Links das Attribut target = "_blank", die automatisch die richtigen Links.

Transformation de ces liens en liens Technorati Transformation dieser links in Technorati Links

Après avoir récupéré le résultat de XScrape dans un fichier texte, une simple opération de remplacement suffit à obtenir les liens Technorati : Nachdem ich das Ergebnis XScrape in einer Textdatei, einem einfachen Austausch Betrieb nur auf die Technorati Links zu erhalten:

  • Remplacer http:// par : http://www.technorati.com/blogs/ Ersetzen Sie http:// mit: http://www.technorati.com/blogs/

Pour l'instant, je n'ai pas encore trouvé le moyen d'analyser une page html sans utiliser une adresse http. Denn jetzt habe ich noch nicht einen Weg gefunden, eine HTML-Seite ohne Verwendung eines HTTP-Adresse zu analysieren. J'ai donc mis cette page sur mon serveur local pour que XScrape puisse trouver le fichier. Also setzte ich diese Seite auf meinem lokalen Server für XScrape können die Datei zu finden. Cela donne une adresse du genre http://localhost/ … Dies gibt eine Adresse vom Typ http://localhost/ ...

Récupération automatique des indices Technorati de tous les blogs AutoWiederherstellen Technorati indiziert alle Blogs

Pour récupérer les indices de technorati des blogs de la liste de Priscilla Palmer, il suffit d'exécuter XScrape avec les paramètres suivants : Um den Index des Blogs abzurufen technorati Liste von Priscilla Palmer, führen Sie einfach XScrape mit den folgenden Parametern:

URL : http://localhost/lienstechnorati.html (la page qu'on a construit à l'étape précédente) URL: http://localhost/lienstechnorati.html (die Seite, die im vorherigen Schritt gebaut wurde)

Inclusive URLs : http://www.technorati.com/blogs/ Inclusive URLs: http://www.technorati.com/blogs/

Exclusive URLs : http://www.technorati.com/blogs/tag/ Exklusive URLs: http://www.technorati.com/blogs/tag/

Regular Expression : <a[^<>]*class=”links”[^<>]*href=”/search/[^<>]*title=”View[^<>]*blog[^<>]*reactions”>Authority: [^<>]*</a>[^<>]*</div>[^<>]*<div>[^<>]*<a[^<>]*class=”fav Regular Expression: <a class = [^<>]* "Links "[^<>]* href =" / search /[^<>]* title = "View [^<>]* Blog [^<>] * Reaktionen "> Authority: [^<>]*</ hat >[^<>]*</ div >[^<>]*< div >[^<>]*< hat [^<>]* Klasse = "fav

Pour trouver la bonne expression régulière, il faut consulter le code source d'une page de blog Technorati. Um den korrekten regulären Ausdrucks zu finden, muss es den Quellcode zu konsultieren für eine Technorati Blog-Seite. Ensuite en tatônnant un peu, on obtient finalement la bonne expression régulière. Dann tastete ein wenig, erhält man schließlich die richtige regex.

Notons que cette méthode m'a permi de récupérer environ 80% des indices technorati, et ceci pour 3 raisons : Beachten Sie, dass diese Methode mich zu etwa 80% der Indizes erholen technorati erlaubt, und dies aus 3 Gründen:

1/Certains liens ne correspondaient pas à la racine du blog 1/Certains Links entsprechen nicht an die Wurzel des Blogs
2/Certains liens n'ont pas encore d'indice car personne n'a encore lié à leur blog 2/Certains Beziehung nicht-Index, denn niemand hat ihren Blog verlinkt
3/Certains liens ne sont pas des blogs 3/Certains Links sind nicht Blogs

Triage des informations obtenues Sortierung gewonnenen Informationen

Avec un peu d' Mit ein bisschen excel excel et un peu d' und einige autohotkey AutoHotkey , on peut faire des merveilles. Kann Wunder bewirken.

Voici comment j'ai procédé : Hier ist, wie ich fuhr fort:

  • J'ai d'abord supprimé dans la sortie obtenue toutes les données inutiles Ich zuerst gelöscht allen daraus resultierenden Output-Daten unbrauchbar
  • Puis j'ai transformé le fichier en format CSV par des remplacements successifs pour obtenir des lignes où les colonnes sont séparées par des points virgule, pour pouvoir l'importer dans Excel : Dann änderte ich die Datei im CSV-Format durch sukzessive Ersatz für Zeilen, in denen die Spalten durch Semikolons getrennt sind, nutzen zu können, um sie in Excel zu importieren:

    http://www.threesixtyalliance.com/360-view;6 http://www.threesixtyalliance.com/360-view; 6
    http://www.todayisthatday.com/blog;314 http://www.todayisthatday.com/blog; 314
    http://www.positiveselftalkguide.com;46 http://www.positiveselftalkguide.com, 46
    etc. etc..

  • Pour connaître les blogs dont on n'a pas pu avoir l'indice, il est intéressant aussi d'importer les données de la liste obtenue lors de l'étape 1 dans le même fichier excel afin de faire une comparaison. Um die Blogs, konnten sie nicht an den Index zu finden, ist es auch interessant, Liste in Schritt 1 Daten in der gleichen erhalten Import Excel, um einen Vergleich zu machen.
  • Grâce à un Durch eine script script autohotkey, on peut ensuite facilement faire correspondre les colonnes et obtenir un résultat de ce genre : AutoHotkey, können Sie leicht mit den Säulen und erhalten ein Ergebnis wie folgt aus:

    Fichier excel des blogs

    (il ya en tout 727 lignes) (es gibt insgesamt 727 Zeilen)

  • On peut ensuite trier les lignes et exporter toutes ces données dans un fichier HTML pour obtenir la liste finale. Wir können dann sortieren Sie die Zeilen und exportieren Sie alle diese Daten in einer HTML-Datei für die endgültige Liste.

Conclusion Fazit

J'espère que grâce à cet article, vous aurez pu découvrir la puissance de XScrape. Ich hoffe, dass durch dieses Artikels finden Sie entdeckt die Macht der XScrape haben. On remarquera qu'il est possible de faire la même chose en utilisant l'API de Technorati, mais la méthode présentée ici a l'avantage de ne nécessiter aucune connaissance en programmation. Beachten Sie, dass es möglich ist, das Gleiche mit der Technorati API, aber das hier vorgestellte Verfahren hat den Vorteil, nicht verlangt keine Programmierkenntnisse.

Dans le prochain article, vous trouverez la liste complète des blogs de développement personnel de Priscilla Palmer triés selon leur indice Technorati. Im nächsten Abschnitt finden Sie die komplette Liste der persönlichen Entwicklung zu finden Blogs Priscilla Palmer nach ihrem Index Technorati sortiert.

Tags: Tags: , , , , , , , , , , , , , , , , , , , , , ,

Articles similaires (en théorie) : Wie (in der Theorie):
Il ya un an sur C'éclair! Vor einem Jahr auf diesem Thread! - mars 2008 - März 2008
Stats Statistik:
XScrape : un logiciel gratuit pour extraire des données à partir du web XScrape: eine Freeware, um Daten aus Web-Extrakt
Page de stats : où trouver les meilleurs scripts de statistiques Page stats: Wo finden Sie die besten Drehbücher Statistiken
Il ya un an sur C'éclair! Vor einem Jahr auf diesem Thread! - février 2008 - Februar 2008

2 commentaires 2 Kommentare » "

  1. Jean Michel Jean-Michel said, gesagt,

    Wrote on Schrieb am mars 10, 2008 @ 20:05 10. März 2008 @ 20:05

    Un tuto bien expliqué Ein Tutorial, gut erklärt :) beau travail gute Arbeit

    Bonne fin de journée:) Gut Ende des Tages:)

  2. Wojciech Wojciech said, gesagt,

    Wrote on Schrieb am mars 28, 2009 @ 0:56 28. März 2009 @ 0:56

    Hello admin. Hallo admin. Very good web site, great work and thank you for your service. Sehr gute Website, tolle Arbeit und danke Ihnen für Ihren Dienst. for Youre a genius! für Youre a genius! spring, Thank you for your site Frühling, ich danke Ihnen für Ihre Website


Un rétrolien Ein Trackback

  1. Comment trier une liste de blogs selon leur indice de popularité Technorati? Wie man eine Liste von Blogs nach Technorati Popularitätsindex sortieren?

Comment RSS Kommentar RSS · · TrackBack URI TrackBack URI

Ajoutez un commentaire Add a comment

Nom : Name:

E-mail: E-mail:

Website: Website:

Comment: Kommentar: