技术

Crawlee—一个用于 Node.js 的网络爬虫和浏览器自动化库,用于构建可靠的爬虫。使用 JavaScript 和 TypeScript。提取数据以供 AI、LLMs、RAG 或 GPTs 使用。从网站下载 HTML、PDF、JPG、PNG 等文件。与 Puppeteer、Playwright、Cheerio、JSDOM 和原始 HTTP 配合使用。支持有头模式和无头模式,并带有代理轮换功能。在线地址:https://apify.com/store

https://twitter.com/yadong_xie/status/1774672630194520283

官网的 twitter 数据是假的,有点败好感(2024.4.3

life

video

有意思的