进来遇到很多英语生词,工具书上给的解释错误百出,而很多在线词典不但可以给出某个单词的解释,而且有大量的示例,因此猜想利用在线词典批量查询这些单词。怎么实现呢?
首要问题是如何自动获取某个单词的解释。搜索之后,发现可以用curl实现,如
试过GoogleDictionary之后发现,curl下来的网页用html2text转换时会报错:Inputrecodingfailedduetoinvalidinputsequence.尝试了Python版的html2text之后,依然有大量的javascript和HTML代码残留。于是转而求助于百度词典——因为百度词典的搜索结果中没有Javascript语句,html2text一般可以完美转换。
转换完之后的文件如下,编码为UTF-8.
#!/usr/bin/perl-w###############censor.pl##################Handletheexplanationsgotfromonlinedictionary.#Inputs:#ARGV[0]--temparoryfilecontainningtheexplanations#ARGV[1]--keyword############################################usestrict;useEncode;my$syntax=Encode::decode('utf8','语法标注解释');my$internet=Encode::decode('utf8','以下结果来自互联网网络释义');my$yingyin=Encode::decode('utf8','英音');my$meiyin=Encode::decode('utf8','美音');my$write_flag=0;open(EXP,$ARGV[0]);while(my$nextline=
运行上面的脚本后,可以得到如下的输出:
antiseptic英音:[,nti'septik]美音:[,nt'sptk]形容词a.1.抗菌的,防腐的2.使用抗菌剂的,使用防腐剂的antiseptictreatment防腐处理3.未受感染的,无菌的,消过毒的Thetechnicianhadonanantisepticwhitejacket.那个技术员穿着消毒白色夹克。4.非常整洁的5.冷淡的,缺乏热情的Henoddedanantisepticgreeting.他冷冷地点头打了个招呼。名词n.1.抗菌剂,防腐剂[C]
另外,如果要自动化查询一批英文单词,可以把它们写到一个文件中,然后用下面的脚本进行自动查询
Update2011-01-02:
终于找到了查询GoogleDictionary的一种方法。
注意到有一行信息:
包含单词abandon的中文释义。于是可以利用curl获取到GoogleDictionary的翻译网页,然后直接在获取的网页中查找上面那一行信息。
2011-01-03Update:
奉上完整版的程序:
如果遇到库中没有的单词,工具可能需要依赖网络服务,如使用API接口查询在线词典,获取单词的正确音标。在实际操作中,用户只需将包含单词的文本文件导入到工具中,软件会逐行读取并处理单词。处理后的结果通常会...
《英汉词典TXT格式》是一种常见的电子词典资源,主要以纯文本文件的形式存储了大量英语单词及其对应的汉语翻译。这种格式简单易用,便于在各种设备上阅读和搜索,尤其适合编程爱好者和学习者进行数据处理。下面将...
牛津词典是全球知名的权威英语学习资源,其TXT格式的词典文件为用户提供了方便的数据处理和查询方式。本资源包含了一个可轻松转换为数据库的牛津词典TXT文件,这对于开发者、语言学者以及教育工作者来说,具有极高的...
《英英文本字典》是一款以txt文本形式呈现的英英字典资源,它主要针对英语学习者和爱好者,提供详尽的英语单词解释、例句以及用法指导。这样的文本字典通常包含了大量的词汇信息,是提升英语阅读、写作和翻译能力的...
例如,英语学习者可以利用词典工具进行单词查询和例句学习,编程爱好者则能通过编程教程学习新的编程语言或技能。最后,“网络”类工具可能提供网络诊断、网页抓取、SEO分析等服务。用户可以检测网络速度,了解...
本资源“words.zip”提供了一个英汉词典的TXT格式版本,包含大约6万多条词汇,旨在为英语学习者、翻译工作者以及编程人员提供便捷的查询服务。这种压缩文件形式便于存储和传输,且易于被各种编程语言处理,是数据...
在代码实现上,可能采用了正则表达式进行模式匹配,结合字典或映射表来实现单词的替换。此外,考虑到Python3是目前广泛使用的版本,此工具极有可能兼容Python3.x系列,确保了在多种环境下都能稳定运行。该工具的...
7.**批量处理**:对于多个文件,Hunspell能够逐个文件地进行拼写检查,并输出结果。8.**输出格式控制**:用户可以控制Hunspell的输出格式,如是否显示建议词、输出到文件等。9.**高级命令行选项**:通过丰富...
它提供了丰富的字典支持,包括多种语言,此处特别提到了英语(en)。描述中提到的"离线安装包,测试可用。使用pipinstall[完整包名]进行安装"意味着这个压缩包是一个离线安装程序,用户无需连接互联网即可进行...
SCOWL是一种广泛使用的开源字典资源,为拼写检查器提供了丰富的词汇支持,涵盖了多个英语变体和专业术语。这款工具可能对教育、写作或编程领域的人士特别有用,他们需要根据特定需求筛选和整理词汇。在Kotlin编程...
此程序的目标是随机打乱输入单词的字母顺序,并检查打乱后的组合是否构成一个有效的英语单词。这里利用了Python的标准库itertools中的permutations函数以及nltk库中的words模块来实现这一功能。####...
-利用内置的翻译功能快速获取单词释义。**43.巧用表格制作作文纸**-设计带有网格线的表格作为作文纸背景。**44.用Word为日语中的汉字标注假名**-利用拼音指南功能为汉字添加假名标注。**45.快速将网页...
它采用了一些内存优化策略,如使用紧凑的字典存储和高效的查找算法,以减少资源消耗。3.**多语言支持**一个显著的特点是,JamSpell支持多种语言的拼写检查,包括但不限于英语、法语、德语、西班牙语等。这得益...
5、英语单词与解释分类:可以将中小学英语单词按照有几个连续字母相同来分类,例如可以将单词中含4个连续相同字母的单词分为一类(标注相同序号);还可以将中小学英语单词的解释按照有1个或2个汉字相同来分类(标注...
-选中单词或短语,使用“审阅”选项卡下的“翻译”功能。**43.巧用表格制作作文纸**-创建一个简单的表格,调整行高和列宽,设置网格线为虚线。**44.用Word为日语中的汉字标注假名**-使用“插入”→...
-使用“审阅”选项卡下的“翻译”功能快速查看单词或短语的翻译结果。**43.巧用表格制作作文纸**-创建带有网格线的表格,调整表格属性使其满足作文纸的要求。**44.用Word为日语中的汉字标注假名**-使用...
-使用内置的词典功能来查找单词的翻译。43.**巧用表格制作作文纸**-使用表格来创建网格状的作文纸模板。44.**用Word为日语中的汉字标注假名**-使用“拼音指南”功能来为汉字标注假名。45.**快速将...
通过“审阅”选项卡下的“翻译”功能可以实现单词或短语的翻译。43.**巧用表格制作作文纸**设计作文纸可以通过插入表格并调整行高列宽来完成。44.**用Word为日语中的汉字标注假名**通过“插入”>“文本...