找回密码
 注册

微信登录

微信扫一扫,快速登录

查看: 1124|回复: 13

[其它] 请问各位大牛,德语文本挖掘有什么傻瓜工具可以用啊?

[复制链接]
发表于 2016-8-2 05:58 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册 微信登录

×
老板想找人分析email,看这几年客户的email出现了哪些关键词。。。
但是老板不懂什么技术,打算叫人一个一个把email读了,然后分类虽然任务还没有分配下来,但是可以肯定是我来做这事。。。
6年的email。这个数量不是开玩笑啊。。。
后来想到貌似有文本挖掘的工具,可惜我不是学这个的,查了下中文资料,发现中文有傻瓜工具,输进去就行了。。。
不知道有没有支持德语的傻瓜文本挖掘工具?
我唯一需要的功能,就是文字出现频率。。。
还是,文本挖掘,必须要先学习Python ?
求大牛们给我指一条明路,不求解决问题,只求一个方向。。。
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
发表于 2016-8-2 19:00 | 显示全部楼层
本帖最后由 博士祭酒 于 2016-8-2 19:15 编辑

根据你的描述,你老板让你做的,
应该是最基础的 qualitative coding,
而并非你和其他几位所认为的 quantitative,
你具体要做的,叫作 grounded codes,
是文本分析和话语分析的一种,
属于社会科学的范畴(因为你是要分析人类的语言,而不是分析计算机代码),
所以一般用 NVivo!

点评

非常感谢,我现在去查查NVivo这方面的资料  发表于 2016-8-2 20:08
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
回复 支持 1 反对 0

使用道具 举报

发表于 2016-8-2 07:40 | 显示全部楼层
本帖最后由 Sky23 于 2016-8-2 06:41 编辑

单击开链:
Data mining with R : learning with case studies



点评

非常感谢!!!  发表于 2016-8-2 10:36
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
回复 支持 反对

使用道具 举报

发表于 2016-8-2 09:37 | 显示全部楼层
本帖最后由 harryzs 于 2016-8-2 09:40 编辑

着急的话,花点钱找个人就分析了。

不着急的话,Python是你的首选。 R在Data science领域肯定很强大,不过单是文本挖掘还是python稍微强一点,而且python比较容易上手。

最佳组合应该是Python提取信息, R 做machine leraning,特别是后续如果你需要建立预测模型,R 简直太强大了。

https://datawarrior.wordpress.co ... hon-on-text-mining/


PS: R python julia 号称Data science 新三剑客。。。
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
回复 支持 反对

使用道具 举报

 楼主| 发表于 2016-8-2 10:43 | 显示全部楼层
harryzs 发表于 2016-8-2 09:37
着急的话,花点钱找个人就分析了。

不着急的话,Python是你的首选。 R在Data science领域肯定很强大,不 ...

非常非常感谢!现在去找python的资料
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
回复 支持 反对

使用道具 举报

发表于 2016-8-2 18:22 | 显示全部楼层
本帖最后由 Sky23 于 2016-8-2 21:28 编辑
lulu家的主人 发表于 2016-8-2 09:43
非常非常感谢!现在去找python的资料

书:
1. lerning python
2. Introducing Data Science: Big Data, Machine Learning, and more, using Python tools
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
回复 支持 反对

使用道具 举报

发表于 2016-8-2 18:38 | 显示全部楼层
免费数据挖掘软件:
单击开链:
weka
orange

点评

谢谢你一连给了我好几个链接,真的很感谢  发表于 2016-8-2 20:08
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
回复 支持 反对

使用道具 举报

发表于 2016-8-2 20:19 | 显示全部楼层
  有很多词频统计软件,有免费的,收费的,淘宝上国人自己开发的也就几十元。只是德语,英语的词语有变形,要考虑一下。

点评

词频:Wortfrequenz,Worthäufigkeit。  发表于 2016-8-2 22:27
问一个脑残的问题。。。词频的德语该是什么啊?我怕我Google翻译出来不准。。。。  发表于 2016-8-2 21:38
谢谢你,刚刚在淘宝上查了下,果然超级多,谢谢  发表于 2016-8-2 21:36
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册 微信登录

本版积分规则

Archiver|手机版|AGB|Impressum|Datenschutzerklärung|萍聚社区-德国热线-德国实用信息网

GMT+2, 2025-5-17 05:02 , Processed in 0.112365 second(s), 30 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表