数据流管道中的外部Python依赖关系

2024-06-16 09:51:10 发布

您现在位置:Python中文网/ 问答频道 /正文

python依赖项可以加载到google云数据流管道中吗?我想使用gensim's phrase modeler逐行读取数据,以自动检测常见短语/双元组(经常出现在彼此旁边的两个单词)。因此,管道的第一次运行将是将每个句子传递给这个短语modeler。第二次通过管道将使用相同的短语建模器,并将该短语建模器应用于每个句子,以识别应一起建模的短语(如果“机器”和“学习”在语料库中经常相邻出现,则它们将转换为单个单词“机器学习”。这能在数据流中完成吗?是否可以在工作计算机上强制传递生成/需求文件pip install gensim?在


Tags: 文件机器管道计算机google读取数据建模单词