Quantcast
Channel: 《基于大规模语料的新词发现算法》的评论
Browsing all 9 articles
Browse latest View live

作者:C.D.

继续拜读Matrix牛的文章

View Article



作者:哎哟

我““路过哈“

View Article

作者:CC

牛掰

View Article

作者:visioncoder

“内部凝固程度”?码农的汉语水平着实堪忧啊!!

View Article

作者:Ricky

内部凝固度,个人理解 是否直接用 “互信息” P(w1w2)/P(w1)P(w2)

View Article


作者:欧阳修

基本是很浅的科普类文章

View Article

作者:lingandcs

基本上,这个方法很多人用过了,建议多做做参考文献工作。 关于新词发现,其实跟整句的分词工作密不可分。在当前的学术界和工业界系统中,很少有专门做发现新词的,大家都是把分词和新词发现放在一起做。 state of art是用CRF先做一遍supervised learning,然后用DLG做一遍unsupervised...

View Article

作者:sepcity

matrix67 是大神啊。·~

View Article


作者:Lucosax

你好,我是标题党。。。这个标题正好和我前一阵子研究生开题很像。这里我想问这么几个问题:像是新词,或者是web的NER有没有一些现有的数据集(感觉人民日报有点过时了) 还有,您题目所谓的大规模是指的什么,我没有看懂 谢谢

View Article

Browsing all 9 articles
Browse latest View live




Latest Images