(中英文)词频统计工具

(中英文)词频统计工具,可以统计一批Word文档(.doc;.docx)、网页文件(.htm;.html)或文本文件(.txt)中所有中英文单词出现的总次数,或分别在各文件中出现的频率。 统计结果可以按出现次数排序输出为Excel表格、网页表格或Word表格文档。

统计方式包括:

可以选择只统中文词汇、英语词汇或标点符号。支持自定义词汇库(例如一些品牌名词,如“京东”“南极人”等会被分开成几个单词的非标准词通过添加到词库实现准确统计)。

(中英文)词频统计工具
(中英文)词频统计工具-统计结果

下载词频统计工具3.7

非凡软件站下载

词频统计

常见问题

词汇提取工具

词汇提取工具(词汇表生成工具),可以将一个或多个Word文档(.doc;.docx)、网页文件(.htm;.html)或文本文件(.txt)中所有(中文或英文)单词提出来形成词汇表。

输出结果排除重复单词,也可做为词汇表去重工具使用。

词汇提取工具

下载 词汇提取工具1.41

字频统计工具

统计一批文件中汉字出现次数的工具。

字频统计工具

下载 字频统计工具 1.4心愿下载站下载

 

重复内容查找工具

文档重复内容查找工具:

  1. 对一个(或一批)文件中的重复出现的句子、短句、短语、字符串或重复词汇进行查找、提取,并统计其重复次数。
  2. 查找多个(所有)文件中都重复出现的内容。
  3. 查找一个(或一批)文本文件中的重复行。
  4. 输入特定内容,查找在文件中的出现(重复)次数。

可以对Word文档(*.doc;*.docx)、文本文件等多种格式文档进行重复文字查找、分析。

用“重复内容查找工具”提取的小说《红楼梦》重复内容 用“重复内容查找工具”分析金庸小说
分析小说《红楼梦》重复内容
分析金庸小说重复内容
下载 重复内容查找工具2.0

常见问题

 

文档查重工具

根据指定的标准(重复内容的长度、次数),判断出某个文档是否和指定目录下的哪些文档存在重复内容。例如,我们可以设定标准,如果两个文档之间有2条以上超过100个字的内容雷同,即认为这两个文档存在重复内容。“文档查重工具”可以按此类标准找出某个目录下的一批文档中,哪些文档和比较文档存在内容雷同。

下载 文档查重工具1.0

文档重复内容查找工具和文档查重工具的主要区别:两个工具的目标不同,文档重复内容查找工具主要是目标是解决“重复内容是什么”, 文档查重工具主要是目标是解决“和哪些文档有重复”。