Een korte Q & A over dit instructable.
Q: welke de #$% * is web sloop en waarom doet iemand nodig?
A: de meest van de webpagina's op het internet bieden niet een web API, en u een nodig. Het idee is om gegevens van de webpagina gestructureerd op een manier die kan worden gebruikt door uw toepassing (een script, een uitvoerbaar bestand, een webpagina of zelfs een database).
V: waarom?
A: laat zien, zoekt een appartement in stad X, binnen een bepaald gebied, en het moet over Y vierkante meter, u kunt zoeken naar whit de hulpprogramma's (maar soms uw criteria kan niet zoeken-door de pagina's), maar de resultaten zijn niet gepresenteerd in de manier waarop u moet/willen. Nu denken over een script dat krijgt de gegevens voor stad X in de manier waarop zijn best voor uw post verwerking, je dan automatisch voor het bepaalde gebied zoeken en weergeven alleen de appartementen die over Y zijn vierkante meter als een lijst met de goedkoopste eerste gesorteerd. Dit alles door alleen een dubbele klik op en werkt op Windows, Mac of Linux.
V: is schrapen juridische?
A: het is niet ilegal, je niet de gegevens die u niet geacht worden te krijgen, je gewoon het krijgen in een geautomatiseerde manier en als je het goed doet u de server niet nodig verzoeken niet spam.
V: het zal altijd werken, zoals een web API?
A: Nee, als de webpagina wordt gewijzigd in een formulier dat is van invloed op uw lezingen moet u uw script wijzigen naar de nieuwe gegevensindeling. Niets te groot of hard, ik kan het doen in onder 1 minuut.
V: kan ik gegevens dat wordt niet verondersteld om door benaderd, zoals met SQL Inject krijgen?
A: Nee, u kunt niet schrapen is geen hacken, het is gewoon een manier om alleen wat u nodig hebt van een of meer websites.