Stap 4: De gegevens zoeken
Dit was het leuke deel, waaronder uren van internet onderzoek in de loop van een paar maanden. In tegenstelling tot het hulpprogramma's winkel, terwijl het doen van internet onderzoek u whiskey kunt drinken! Dit hielp met het gezwoeg van de zeven door datasets.
Ik schuurde door gegevens op repos van GitHub , overheidswebsites, door middel van persoonlijke contacten en meer. Sommige van de 'slechte gegevens' leek te gelokaliseerde (zoals San Antonion drank verkoop), terwijl anderen leek meer zin te maken zoals de locaties van alle van de Amerikaanse gevangenissen in de wereld.
De laatste twaalf gegevenssets "slechte" Ik koos waren):
* 2015 Airbnb aanbiedingen in San Francisco (gegevensbron: darkanddifficult.com)
* Meth Labs in Albuquerque (gegevensbron: http://www.metromapper.org)
* Amerikaanse gevangenissen (gegevensbron: gevangenis beleidsinitiatief. prisonpolicy.org)
* U.S. massa schietpartijen (1982-2012) (gegevensbron: Mother Jones)
* Op de zwarte lijst IPs (gegevensbron: Suricata SSL Blacklist)
* Internet gegevens overtredingen (gegevensbron: http://www.informationisbeautiful.net/)
* Wereldwijd UFO-waarnemingen (gegevensbron: nationale UFO rapportage Center (NUFORC))
* Wereldwijd Haunted locaties (Bron: Wikipedia)
* Missouri abortus alternatieven (gegevensbron: data.gov (Amerikaanse overheid))
* 18 jaar van San Francisco uitzettingen (gegevensbron: de anti-uitzetting van de Mapping van het Project en het bestuur van de huur San Francisco)
* Southern California Starbucks (gegevensbron: https://github.com/ali-ce)
* Denver marihuanaapotheken (gegevensbron: Denver Open Data Portal)