Semalt Guide On Scraper Extension für Chrome

Damit ein Unternehmen überleben und letztendlich wachsen kann, muss es seinen Wettbewerbern und verschiedenen Risiken einen Schritt voraus sein. Entscheidungen auf der Grundlage von Analysedaten zu treffen, ist ein sicherer Weg, diese Probleme zu vergessen. Solche Daten können durch Datenverschrottung erfasst werden. Hier kommt die einfache Scraper-Erweiterung für Chrome ins Spiel: Sie erleichtert nicht nur den Prozess der Datenerfassung, sondern ermöglicht auch das Scrapen unterwegs ohne komplizierte Einstellungen.

Verwendung von Scraper

    1. Als erstes müssen Sie die Erweiterung installieren. Gehen Sie also zum Chrome-Webshop, suchen Sie nach "Scraper" und klicken Sie auf "Zu Chrome hinzufügen".

    2. Navigieren Sie zu der Website, von der Sie Daten entfernen möchten , und markieren Sie den Eintrag, an dem Sie interessiert sind, indem Sie ihn markieren. Klicken Sie mit der rechten Maustaste darauf und wählen Sie im daraufhin angezeigten Menü "ähnlich kratzen".

    3. Dadurch wird ein separates Scraper-Konsolenfenster geöffnet. Hier sehen Sie eine Liste der kratzenden Daten .

    4. Um den Inhalt zu speichern, klicken Sie auf "In Google-Dokumenten speichern". Dadurch werden die Daten automatisch in eine Google-Tabelle exportiert.

Erweitertes Schaben

Wenn Sie planen, mehr Daten zu kratzen, können Sie den erweiterten Ansatz verwenden. Beachten Sie, dass die Arbeit mit dem Tool viel einfacher ist, wenn Sie über HTML-Kenntnisse verfügen. Angenommen, Sie möchten Daten aus einer Quelle entfernen, deren Archiv auf Zeitreihendaten basiert. In diesem Fall würden Sie die verstümmelten Daten erhalten, wenn Sie die oben beschriebene Methode ausprobieren.

Um dieses Problem zu lösen, können Sie eine HTML- und XML-Abfragesprache namens XPath verwenden. Was tut es? XPath erkennt Daten zu den verschiedenen Elementen, die in jeder Auswahl enthalten sind. Im Folgenden finden Sie eine Anleitung dazu:

1. Gehen Sie zur Scraper-Konsole. Oben links sollten Sie eine Schaltfläche "XPath" sehen. Klicken Sie darauf und fahren Sie mit dem Zusammenstellen der ersten Tabelle fort.

2. Sie müssen den XPath für das richtige Element schreiben. Der aktuelle XPath, der die gesamten Informationen enthält, wird in einem Format wie diesem angezeigt: "// div [3] / div [3] / div [2] / div". Die <div> -Elemente werden vom Computer im HTML-Dokument erkannt.

3. Um die erkannten Daten zu trennen, müssen Sie die Scraper-Spalten verwenden. Dazu müssen Sie nach den verschiedenen Arten von Informationen suchen, die Ihnen zur Verfügung stehen. Abhängig von den Daten, die Sie kratzen, haben Sie möglicherweise Titel. Diese Titel sind neben jedem Datensatz vorhanden. Sie werden von einem Tag begleitet, in diesem Fall einem <b> -Tag.

4. Suchen Sie mit inspect element das <b> -Tag und fügen Sie es Ihrem XPath hinzu. Jetzt können Sie diese erste Spalte als "Titelspalte" bezeichnen, da sie die Titel auflistet. Erstellen Sie verschiedene XPaths für jede Spalte, die Sie benötigen.

5. Klicken Sie auf den Scrape. Die Erweiterung sammelt die Daten automatisch und organisiert sie in den verschiedenen Spalten, die Sie festgelegt haben.