word2vec 中的数学原理详解

jopen 10年前

word2vec 是 Google 于 2013 年开源推出的一个用于获取 word vector 的工具包,它简单、高效,因此引起了很多人的关注。由于 word2vec 的作者 Tomas Mikolov 在两篇相关的论文 [3,4] 中并没有谈及太多算法细节,因而在一定程度上增加了这个工具包的神秘感。一些按捺不住的人于是选择了通过解剖源代码的方式来一窥究竟,出于好奇,我也成为 了他们中的一员。读完代码后,觉得收获颇多,整理成文,给有需要的朋友参考。

20140720155709031 1041x1155

20140720155902859 1027x466

20140719215746100 1047x889

20140719215519250 1040x1561

20140820233742625 1042x545

20140719220053359 1045x1532

20140719220344604 1046x1449

20140719220357849 1044x1546

20140719220132062 1044x1342

20140719220426069 1040x1561

20140820233921062 1042x545
20140719220904670 1044x1512

20140719220634640 1043x1567










20140719221547541 1042x1535


20140719221608164 1043x1570



20140719221638927 1044x1560

20140719221649473 1044x1568






20140820234614791 1041x1569

20140820234438343 1041x1514


20140820234723187 1042x1571

20140820234913833 1046x308


20140820234336482 1042x545
20140720233442261 1023x1519









来自:http://suanfazu.com/t/word2vec-zhong-de-shu-xue-yuan-li-xiang-jie-duo-tu-wifixia-yue-du/178