如何用数据分析,搞定新媒体运营的定位和内容初始化?
这段时间全网关于“青春文学”的信息量分布情况,如下图所示: 全网关于“青春文学”的信息量分布 将这些文本数据导出到本地,形成Excel格式文件,再按“青春文学”文本数据在上述传播渠道中所占的比重进行相应分层随机抽样,并进行同比例的人工随机抽样校准(看抽取的样本有没有问题,有的话及时剔除,再进行补充),最终得到1526条文本数据,如下图所示: 经抽样得到的最终分析文本数据 3.2 词频分析 经过系统处理,从这些定性语料中抽取出若干关键词形成词云,可以获得这些语料的初步印象,有一个直观的判断,见下图: 定性语料形成的关键词云 从上述关键词词云中,能直观的看到“爱情”、“故事”、“关系纠葛”(他们、你的、她们、她的、我们)、“青春”这些关键词,由此在直观上可以对公众号的内容运营方向有一个“朦胧”的感觉。 不过,这还不够细致,我们还需要进行更为深入的分析。 将语料中最为重要的150个关键词(按词频和权重)进行提取,下载到本地,然后基于对“青春文学”背景知识的了解,进行人工的词汇定性分类(见颜色标注),如下表显示: 从语料中提取出的150个重要关键词 从上述关键词表中,可以得出以下几类主题: (编辑:应用网_丽江站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |