著名的老牌沙盒软件 Sandboxie 已在 2020 年开源了,以前收费,现在可免费下载使用。博主觉得 Sandboxie 可作为 Windows 下的必备软件之一,尤其适合有“洁癖”和经常下载安装破解软件的玩家。
发表回复
利用 lxml 库的 Cleaner 类清洗标签
lxml 是一款功能强大和易用的 Python 库,主要用来处理 XML 和 HTML,很多爬虫工具都会用到它,而且因为 lxml 是基于 C 语言的 libxml2 和 libxslt 库,所以解析速度会快很多。
本文记录使用 lxml 库里的 Cleaner 类来清洗 HTML 文档中的各种多余元素。
Python 利用 Arrow 库转换时间格式
最近发现个 Python 时间库 arrow,相比 time、datetime 等标准库,arrow 提供了更合理和人性化的方法来创建、操作、格式化和转换日期、时间和时间戳。
scrapy-splash 的访问认证
网上关于 Scrapy-Splash 的教程很多,都讲解了如何安装部署 Splash 并对接 Scrapy 项目,但貌似遗漏了:配置 Splash 访问认证后,如何在 Scrapy 爬虫文件中开启的问题。
nginx 负载均衡 upstream server 参数使用域名
此文记录一个配置 nginx 负载均衡,upstream 中的 server 参数使用域名时出现的问题,虽然最后得到了想要的结果,但还是疑云重重。看到此文的大佬们,如有更好解决方法,还望留言指教博主。
继续阅读
2020 年 12 月跑步记录:腿伤未愈
2020 年 12 月仅跑步 5 次,总共 18.65 公里,平均每次不到 4 公里,平均每公里配速 5 分 41 秒。快两个月了,小腿受伤还没恢复好。
macOS+Windows+Ubuntu 三系统引导设置
前段时间折腾黑苹果,安装过程没多大问题,一次成功。可在设置 macOS+Windows+Ubuntu 多系统的 EFI 引导时花了不少时间,网上相关教程有些老旧,部分细节疏漏导致博主屡次失败,很有必要在此记录。
一次美妙的黑苹果之旅
前两天试着装了个黑苹果,没想到安装过程相当顺利,一次性成功进入系统,各项驱动均正常运行,体验良好。因为没碰到各种“疑难杂症”要解决,所以本文仅做个流水式的记录,可能无法当做教程。