从 Scrapy 到自研:单人长期项目中的爬虫工程判断
对单人长期项目而言,工程问题往往不是“能不能做”,而是“能不能长期承受”。本文记录了我在使用 Scrapy 过程中逐步暴露的工程风险,以及最终选择自研爬虫框架、重新分配工程不确定性的判断过程。
contrails.space
技术 · 折腾 · 生活随想
对单人长期项目而言,工程问题往往不是“能不能做”,而是“能不能长期承受”。本文记录了我在使用 Scrapy 过程中逐步暴露的工程风险,以及最终选择自研爬虫框架、重新分配工程不确定性的判断过程。
拆解 Next.js App Router 中 ISR 的真实工作方式,澄清“为什么数据更新了页面却没变”的根源。从内容型站点的视角理解 ISR 的设计假设、延迟与不一致的必然性。通过真实业务节奏,讨论何时应继续使用 ISR,何时过渡到 on-demand revalidate。
记录一套在群晖上自动申请、部署与续期 SSL 证书的方案:基于 acme.sh、ZeroSSL 与 Cloudflare DNS API,结合 Container Manager 和计划任务实现证书的长期自动化管理。
记录一个 Ant Design Vue 表单上传 Excel 文件时的前端校验方案:通过 xlsx 读取首个 Sheet 并统计数据行数,在文件选择阶段拦截超限内容。
记录一次 Next.js 博客 LCP 性能优化的探索:从 Vercel Speed Insights 发现 LCP 高达 6.2 秒,分析 banner 图片加载缓慢的根因,并深入研究 Next.js Image 组件 priority 属性的实现机制与实际效果。