基岩是一个高级别的文本预处理API,用Python编写,可以以NLTK或SPACY作为后端运行。
bedrock的Python项目详细描述
你发现了基岩
基岩是一个高级文本预处理api,用python编写 可以在nltk或spacy上作为后端运行。它能让你很快 在不需要的情况下执行文本处理基础工作。它可以 卑微的工作,所以你不必。
如果您发现以下亮点有用,请使用此库:*快速 原型*在不同后端之间切换*分批工作, 而不是编写循环*支持数据帧输入/输出
立即安装基岩:
pip install bedrock bedrock download all
在10秒内从零变为基本英雄
现在您可以运行
importbedrockbedrock.process.pipeline('Hallo Welt')
恭喜!:tada:
发动机和语言
目前基岩支持以下引擎:*spacy*nltk
以及以下语言和相应的下载参数:* 英语('en'或'english')*德语('de','german'或'deutsch')
安装和使用
软件包安装
pip install bedrock
安装对所有语言的支持:
bedrock download all
仅安装英文版的支架:
bedrock download en
安装德语支持:
bedrock download de
从代码中的包导入模块:
frombedrockimportprocess# Processing textsfrombedrockimportcollection# Loading data collectionsfrombedrockimportcommon# Some common functionsfrombedrockimportfeature# Feature extractionfrombedrockimportviz# Visualizations