Semalt-opas Chromen kaavinlaajennuksesta

Jotta kaikki yritykset selviäisivät ja lopulta kasvaisivat, on välttämätöntä pysyä kilpailijoidensa ja erilaisten riskien edessä. Analyyttiseen tietoon perustuvien päätösten tekeminen on varma tapa unohtaa nämä ongelmat. Tällaisia tietoja voidaan hankkia tietojen romutuksella. Sieltä tulee helppo Chromen kaavinlaajennus : se ei vain helpota tietojen keruuprosessia, vaan myös mahdollistaa kaavinta tien päällä ilman monimutkaisia asennuksia.

Kuinka käyttää kaavinta

    1. Ensimmäinen asia, joka sinun on tehtävä, on asentaa laajennus, joten siirry chrom-verkkokauppaan, etsi "kaavin" ja napsauta Lisää Chromeen.

    2. Siirry verkkosivustoon, josta aiot kraapia tietoja , merkitse kiinnostunut merkintä korostamalla se. Napsauta sitä hiiren kakkospainikkeella ja valitse ponnahdusvalikosta "kaavin samanlainen".

    3. Näin avataan erillinen kaavin konsoli-ikkuna. Täällä näet luettelon kaapatut tiedot .

    4. Tallenna sisältö napsauttamalla "tallenna Google-tiedostoihin". Tämä vie tiedot automaattisesti Google-laskentataulukkoon.

Laajennettu kaavinta

Jos aiot raaputtaa enemmän tietoja, voit käyttää edistynyttä lähestymistapaa. Huomaa, että työkalun kanssa työskenteleminen on paljon helpompaa, jos sinulla on HTML-tietämystä. Oletetaan, että halusit kaadata tietoja lähteestä, jolla on aikasarjatietoihin perustuva arkisto. Jos kokeilet yllä kuvattua menetelmää, saat tällöin väärät tiedot.

Tämän ongelman ratkaisemiseksi voit käyttää HTML- ja XML-kyselykieltä, joka tunnetaan nimellä XPath. Mitä se tekee? XPath tunnistaa kunkin valinnan eri elementtejä koskevat tiedot. Seuraava on opas siitä, miten sen saavutetaan:

1. Siirry kaavin konsoliin. Vasemmassa yläkulmassa sinun pitäisi huomata "XPath" -painike, napsauttaa sitä ja jatkaa alkuperäisen taulukon kokoamista.

2. Sinun on kirjoitettava XPath oikealle elementille. Nykyinen XPath, joka sisältää kaikki tiedot, näytetään seuraavassa muodossa: "// div [3] / div [3] / div [2] / div". Tietokone tunnistaa <div> -elementit HTML-asiakirjassa.

3. Tunnistettujen tietojen erottamiseksi on käytettävä kaavinsarakkeita. Tätä varten sinun on etsittävä käytettävissäsi olevia erityyppisiä tietoja. Kaapattavista tiedoista riippuen sinulla voi olla nimikkeitä. Nämä otsikot ovat läsnä jokaisen tietojoukon vieressä. Niiden mukana on tunniste, tässä tapauksessa <b> tunniste.

4. Etsi tarkistuselementtiä käyttämällä ja lisää <b> -tunniste XPath-tietokantaan. Nyt voit merkitä tämän ensimmäisen sarakkeen "otsikkosarakkeeksi", koska se luettelee otsikot alas. Jatka erilaisten XPath-polkujen luomista jokaiselle tarvitsemallesi sarakkeelle.

5. Napsauta kaavinta, niin laajennus korjaa tiedot automaattisesti ja järjestää ne määrittämiisi sarakkeisiin.