| 小学 | 中考 | 高考 | 自考 | 成教 | 考研 | 外语考试 | 资格考试 | 英语教学 | 学生习作 | 论文写作 | 信息服务 | 下载中心 | 知心港湾
| 英语 | 语文 | 英语 | 动态 | 成考 | 英语 | 职称外语 | 教师资格 | 大学英语 | 写作指南 | 本科论文 | 招聘就业 | 听力 MP3 | 网络精品
 当前位置:网站首页 > 论文写作 > 论文资源 > 浏览正文
几款简单的词频分析神器
www.hrexam.com   更新时间:2017-04-17 点击: 【字体: 】 加入收藏 关闭本页

  词是承载文献内容的最小单位。词频的波动与社会现象、情报现象之间具有内在的关系,一定的社会现象和情报现象必然引起相应的词频波动现象。因此,如果某一关键词出现总频率越高,那么该关键词就是该研究领域的热点研究方向;如果某一关键词在近期出现,且增长幅度比较大,那么该关键词就是该研究领域的新兴研究方向。因此,词频分析的基本原理是通过词出现频次多少的变化,来确定热点及其变化趋势。

  词频分析一般的过程主要分为:数据检索——数据清洗——词汇提取——统计分析等阶段。而数据检索和数据清洗加工决定了原始数据的准确性,从而影响结果分析的可靠性,因而需要特别注意。(未来将专门安排一讲有关的数据清洗方法与工具的内容)。
  今日我们介绍的不是复杂难学的Bibexcel、CiteSpace 、SPSS、SATI等工具,而是几款简单实用的词频分析小工具,功能虽然不够强大,但足以完成一些基础工作。
 
  一、图悦(网址:http://www.picdata.cn)
 
  图悦是由谷尼国际软件提供技术支持的在线热词分析软件。其分析的文件格式必须文本格式,文本最长支持100万汉字。你也可以从网页中、WORD中等地选择你要分析的文本COPY到文本框,界面见图1所示。
  图悦目前采用的分词方法是大词优先原则,比如“改革”和“改革开放”都是词,在统计词频时,“改革开放”中的“改革”不会计入“改革”的词频,算两个不同的词,输出的图有“热词词频图”、“词频柱状图”,图形模式有为标准模式、微信模式和地图模式三种模式供选择。
 
  图1 图悦主界面
 
  我们选择我国的“民法通则”作为分析文本,可得到如下图2、图3所示的热词权重图和热词词频图。
  图2“民法通则”热词权重图
 
  图3 “民法通则”热词词频图
 
  图悦还可以导出Top150的热词,如果想查看全部热词词频,可以点击导出Excel按钮,将所有热词导出到Excel表中,见图4所示,打开Excel表可以看到按从高到低排序的所有热词,见图5所示。
  图4导出热词界面
  图5 Excel表中热词统计
 
  二、NoteExpress(网址:http://www.inoteexpress.com)
 
  NoteExpress 是北京爱琴海软件公司开发的一款文献检索与管理系统,其核心功能涵盖“知识采集,管理,应用,挖掘”的知识管理的所有环节,是学术研究好帮手。
  NoteExpress可对文献信息进行多种统计分析,如作者、关键词、主题词等等,从而快速了解某一领域的重要专家,研究机构,研究热点等。
  NoteExpress的数据既可以从电脑导入,也可以在线检索,其提供50多种在线数据库检索,包括国内外常见期刊论文、图书、会议、专利数据库等,如CNKI、万方、超星、WOS、PubMed、Google Scholar等。
  我们以“数据清洗”为例,选择在线检索从CNKI期刊论文数据库下载了100条记录存入在NoteExpress建立的文件夹中,点击文件夹信息统计,如图6所示,就可以对导入的题录信息进行统计了,我们选择“关键词”作为统计对象,通过调整排序方式,可得到图7所示的结果。
  图6 统计按钮
 
  图7 统计结果
 
  点击图7右下角中的“另存为”按钮,可将统计结果保存为文本格式,见图8所示,之后可将该文本数据导入到Excel中生成各种图形。
  图8 文本文件
 
  三、CNKI自带分析工具(网址:www.cnki.net)
 
  CNKI大家比较熟悉,在此不再赘述。今天主要讨论其数据分析功能。
  仍以“数据清洗”为例,在CNKI中选择篇名字段进行精确检索可以得到151条记录,这时我们可以在页面中间位置看到“计量可视化分析”的按钮,见图9所示。点击此按钮出现“已选文献分析”和“全部检索结果分析”两个按钮。
  图9 计量可视化按钮
 
  点击任一按钮之后,则会对相应文献进行文献计量可视化分析,分析的对象包括文献总体趋势、关键词关系网络、基金、作者、机构、学科、期刊等的统计分布等,见图10。
  图10 计量分析结果
  今天我们只截取有关关键词的部分,可以看到有关这151篇论文的“关键词共现网络”图和关键词词频分布图,见图11、图12所示。
  图11 “数据清洗”关键词共现网络图
  图12“数据清洗”关键词词频分布图
参考文献:陈兰杰等.数字信息检索与数据分析,河北大学出版社,2016
 
 
热点推荐
温家宝2012政府工作报告摘要(英汉对照)
“微心理”你懂多少?
制胜必看:职场女性应该具备的五种魅力
《CCTV经济生活大调查》数据大揭秘
国家公务员面试考生备考时必做三件事
2010年新年感恩与祝福FLASH祝贺新年快乐!
大中华区总裁孙振耀退休感言
全国校园网主页汇总
大一新生英语学习规划书
我们这个时代的尴尬(中英对照)
新概念英语第四册文本及MP3下载
新概念英语第三册文本及mp3下载
新概念英语第二册文本及听力下载
新概念英语第一册文本及听力下载
自信是怎样炼成的
最近更新
华侨大学外国语学院新生开学典礼院长致辞
论文写得好不好,论证才是关键
90所试点高校将公布自主招生初审结果,如
2017年6月必备!最全英语四级翻译专项汇
国学经典100句,看看你的思想有多深刻
西方名著100名句,看看你的眼界有多远
21世纪全球博士教育改革八大趋势,告诉你
让你瞬间词汇量翻倍的英文形容词大全,一
常用英文过渡词和句型
210个高频生活英语口语句子,收藏起来慢
比尔·盖茨给中国学生的建议(英汉对照)
高教头条 | 不再标榜综合排名,多所高校
囧研究:人有19种微笑,但只有6种是开心
一周热词榜(英汉对照 4.15-21)
2017年必备!最全英语四级翻译专项汇总一
内容导航 | 邮箱系统 | 我要留言 | 广告合作 | 与我联系 | 站长信息 | 常见问题 | 关于本站 | 本站旧版
Copyright © 2002 - 2009 hrexam.com. All Rights Reserved