Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

supermarkt.json data scrape #8

Open
myucesan opened this issue Apr 10, 2023 · 5 comments
Open

supermarkt.json data scrape #8

myucesan opened this issue Apr 10, 2023 · 5 comments

Comments

@myucesan
Copy link

Ik zie dat je een .json bestand inlaad die je af en toe update. Hoe scrape je precies de data, als ik vragen mag? Is dat iets wat open source is?

@fbarbe00
Copy link

fbarbe00 commented May 3, 2023

I agree! It would be great if you could share the script for scraping the data, so other people could also contribute (including myself)!

@jusr3124
Copy link

jusr3124 commented May 9, 2023

hier ben ik ook benieuwd naar.

@b-a0
Copy link

b-a0 commented Jun 1, 2023

Here is someone who does something similar, perhaps it is helpful: https://forum.fok.nl/topic/2655492/1/50#p205827772

@lalilaloe
Copy link

@stephan-v
Copy link

Het is op zich niet heel moeilijk om scrapers te bouwen aangezien de meeste supermarkt ketens data aan hun frontend aanleveren via een backend call die je vaak meteen al op kan pakken in je netwerk tab van je browser.

Het probleem is dat deze netwerk requests vaak wel anti-bot/scraper beveiliging hebben zoals Akamai. Wanneer je hard data gaat scrapen en dit doet met een klein interval zullen ze je binnen no-time blokkeren.

De enige betrouwbare manier om hieromheen te werken is om een rotating residential proxy in te zetten. Voor elke request die je maakt krijg je een nieuw ip adres dat niet afkomstig is van een data center maar eentje die toegewezen is door een ISP. Zodoende lijkt het alsof een doodgewone supermarkt consument de website zit te browsen.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

6 participants