System Design — Готовые кейсы

mock_sobes

senior design #705

Спроектируй web crawler масштаба «10B страниц за месяц». Как избегать дублей, как уважать robots.txt и crawl-delay, как parallelize, как хранить?

Чтобы решить вопрос и сохранить попытку — войди.