TOC

新东方英语词典备份

hj

听说沪江英语出于合规的考虑,APP 中下线了中小学英语词书。
我赶紧检查一下我之前的新东方英语词典的脚本, 把没有的爬一份。主要是我今年准备全面学习一下英语,从小学阶段开始,要是到时候小学词典都弄不到就 BBQ 了。

附:相关脚本

跑下来的 HTML 文件: 百度云盘备份 (100M)
提取码:pysm

压缩文件中是大量 html 文件,将其压缩到 ~/SWAP/koolearn/html/,然后执行 koolean.py 就行了。
PS: HTML 文件夹解压之后大概 500M, 脚本运行起来会生成 pickle 文件(大概 240M),JSON 文件(大概 120M)。
PS: 脚本执行完成之后可以删除 html 目录和 pickle 文件。

可以展示目录,或者其中任意词书。