基岩是一个高级别的文本预处理API,用Python编写,可以以NLTK或SPACY作为后端运行。

bedrock的Python项目详细描述


Build Status

你发现了基岩

基岩是一个高级文本预处理api,用python编写 可以在nltk或spacy上作为后端运行。它能让你很快 在不需要的情况下执行文本处理基础工作。它可以 卑微的工作,所以你不必。

如果您发现以下亮点有用,请使用此库:*快速 原型*在不同后端之间切换*分批工作, 而不是编写循环*支持数据帧输入/输出

立即安装基岩

pip install bedrock
bedrock download all

在10秒内从零变为基本英雄

现在您可以运行

importbedrockbedrock.process.pipeline('Hallo Welt')

恭喜!:tada:

发动机和语言

目前基岩支持以下引擎:*spacy*nltk

以及以下语言和相应的下载参数:* 英语('en'或'english')*德语('de','german'或'deutsch')

安装和使用

软件包安装

pip install bedrock

安装对所有语言的支持:

bedrock download all

仅安装英文版的支架:

bedrock download en

安装德语支持:

bedrock download de

从代码中的包导入模块:

frombedrockimportprocess# Processing textsfrombedrockimportcollection# Loading data collectionsfrombedrockimportcommon# Some common functionsfrombedrockimportfeature# Feature extractionfrombedrockimportviz# Visualizations

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
Java中的模板类   java如何创建跨服务域模型映射?   java如何最好地指定与Netty一起使用的Protobuf(最好使用内置Protobuf支持)   java Android Studio计数器文本视图字段未更新   操作属性>添加更改侦听器上的java按钮   Android中JSON参数的java解析   java DynamoDB和全局二级索引和ObjectMapper   JVM的Xmx限制的java外部控制?   java如何在触摸事件中停止图像滑块的自动滚动   java如何在AEM中从/content/dam读取xml文件?   在创建JavaNIO文件系统时,“env”选项(及其用途)是什么?   java如何在jdk 7或更早版本中使用lambda表达式   使用Java清理CSS