文档分类问题的数据集

2024-05-16 03:57:12 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在做一个项目,使一个应用程序,可以采取pdf和docx文件作为输入,并将它们分为不同的类别,如 -财务 -政府与政治 -体育和娱乐 -科技 -敏感(个人和政府) 但是我没有找到足够的数据来训练ML模型

你能告诉我一些地方,在那里我可以找到可以用于我的项目的数据集。我目前只有BBC新闻数据集。我更喜欢数据集是.txt格式还是可以用一些代码或软件转换成.txt格式


Tags: 文件数据项目模型txt应用程序pdf格式