Stap 2: Overzicht en installatie
Er zijn een heleboel verschillende bestanden bij dit project betrokken. Ik heb samen een werkset zipped en hen hier geüpload. Installeren download hen, en unzip allemaal in één map. Ik heb ook sommige bestanden geupload zonder zippen. De bedoeling is dat u op hen klikt en lezen zonder te downloaden, ze zijn allemaal opgenomen in het zip-bestand, en niet afzonderlijk moeten worden gedownload. (ook de ziped bestanden wellicht een beetje meer up to date)
U zal moeten installeren van Python, als het nog niet is geïnstalleerd. Het web staat vol met informatie hierover. Op de Pi is Python vooraf geïnstalleerd. Op de PC I recommend de fundamentele Python voor mensen zonder veel ervaring in de programmering en Spyder (van http://docs.continuum.io/anaconda/ ) voor degenen die ervaren zijn.
Voor het gebruik van de programma's aanbevelen ik dat u ze eerst van een ontwikkelomgeving uitvoeren, en loopt ze later van een file manager of desktop icon toewerken. In deze richtingen zal ik neem aan dat u werkt op een ontwikkelingsomgeving zoals Spyder. Enkele stappen zal afhangen van je OS en andere details van het systeem. Ik zal alleen adres Vensters in dit document.
Veel van de verklaring van de programma's is in de commentaren dat ik niet proberen zal te trekken van de tekst van hen in het lichaam van de instructable, klik en lees ze: dit is waar veel van de instructable inhoud.
De programma's hier sterk afhankelijk zijn van mathplotliben mogelijk andere Python extensions ( Sypder bevat bijna alle van deze standaard, dus is de keuze van een goede installatie)
Hoe het werkt
Het Python programma scrape_views.py verzamelt de gegevens van instructables en zet het in tekstbestanden voor later graphing. Dit wordt geregeld door een bestand met de naam urllist.txt , die heeft de url's (en andere informatie) van de sites te worden geschraapt. Het programma scrape_views.py moet worden uitgevoerd op een regelmatige basis om gegevens voor het grafische programma, graph_views.pyte vergaren.
Het tweede programma, graph_views.py, leest de tekstbestanden met de gegevens en grafieken van de gegevens (en slaat desgewenst de grafieken in PNG -bestanden). Controle van de graphing is opnieuw via urllist.txt. Momenteel zijn er 3 verschillende stijlen van de grafieken, lees de bestanden graph_views.pyen urllist.txt voor meer info.
De programma's gebruiken de Python console voor uitvoer hou je ogen op het.
Ik heb een set van bestanden die gegevens uit een aantal Instructables meest bekeken onderwerpen heeft opgenomen. Hier kun je verschillende opstellingen in verschillende mappen voor het schrapen van verschillende soorten pagina's.
Er is een logboekbestand: views.log
Voor sommige optionele controle over het programma commando lijn kunnen argumenten worden opgenomen. Kijken naar de batch-bestanden, in de sectie van de programma's die het verwerken van de command line ( get_args() ), en aan de onderkant van elk *.py -bestand voor meer opmerkingen.