用张量流估计和数据集实现word2vec

tf-word2vec的Python项目详细描述


word2vec

GitHub releasePyPI releaseBuildMIT License

这是基于tensorflow的word2vec的重新实现 EstimatorsDatasets

安装

在git克隆之后:

python3 setup.py install

获取数据

您可以在此处下载英语维基百科的示例:

wget http://129.194.21.122/~kabbach/enwiki.20190120.sample10.0.balanced.txt.7z

训练字2vec

w2v train \
  --data /absolute/path/to/enwiki.20190120.sample10.0.balanced.txt \
  --outputdir /absolute/path/to/word2vec/models \
  --alpha 0.025 \
  --neg 5\
  --window 2\
  --epochs 5\
  --size 300\
  --min-count 50\
  --sample 1e-5 \
  --train-mode skipgram \
  --t-num-threads 20\
  --p-num-threads 25\
  --keep-checkpoint-max 3\
  --batch 1\
  --shuffling-buffer-size 10000\
  --save-summary-steps 10000\
  --save-checkpoints-steps 100000\
  --log-step-count-steps 10000

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
与ReentrantLock相比,java ReentrantReadWriteLock的性能非常差   java如何使用Maven Android Studio正确导入?   安卓将ADB添加到我的Java PC应用程序   反射Java getDeclaredConstructor失败,来自JUnit的NoSuchMethodException   JSP上siteedit标记库的java替代   JavaSpring环境概要文件和JPA   java中是否有一个类似于StringBuilder的类,唯一的区别是它具有固定的长度?   JavaMathContext。小数点32 vs MathContext。小数点64,使用哪一个,为什么?   java使用spring在Ibm Websphere MQ中实现重试逻辑   java调用SpriteBatch。开始()和结束()   java有一种从文本中读取文本的方法。文件,并将其设置为pom中的maven属性。xml专家?   java让sitemesh使用struts2   Java Swing:在现有窗口上定位对话框   使用带有MemSql的JPA本机查询的java Select json列