我想做一个程序,阅读一个文件,并给我们反馈如何改进它例如一篇文章。到目前为止,我已经把这篇文章分成了导言、发展段落和结论等主要部分。我怎样才能做一个程序,可以给每个段落的反馈,以便用户能够改进它?这种类型的程序是可能的还是技术不够先进。机器学习将是最好的技术。到目前为止,代码并不多,但它是:
import nltk
def parse_essay(essay_filename):
with open(essay_filename, 'r') as file:
paragraphs = [x.strip('\n') for x in file.readlines() if x != '\n' and x != '\t\n']
return paragraphs[0], paragraphs[1], paragraphs[2], paragraphs[3]
def get_introduction_feedback(text):
sentences = nltk.tokenize.sent_tokenize(text)
hook = ' '.join(sentences[:3])
thesis = sentences[3]
arguments = ' '.join(sentences[4:])
def get_development_feedback(text):
pass
def get_conclusion_feedback(text):
pass
if __name__ == '__main__':
ESSAY = 'essay.txt'
intro, dev1, dev2, conclusion = parse_essay(ESSAY)
intro_feedback = get_introduction_feedback(intro)
dev1_feedback = get_development_feedback(dev1)
dev2_feedback = get_development_feedback(dev2)
conclusion_feedback = get_conclusion_feedback(conclusion)
print('Introduction:\n\n{}\n\nDevelopment 1:\n\n{}\n\nDevelopment 2:\n\n{}\n\nConclusion:\n\n{}'.format(intro_feedback, dev1_feedback, dev2_feedback, conclusion_feedback))
它使用的论文文件也是一篇4段的文章,其中第1段是引言,第2段和第3段是发展,第4段是结论。你知道吗
用简单的机器学习是一个很难解决的问题。论文将是非常领域特定的,你需要一个非常广泛的(和标签)论文数据库。你知道吗
一种无监督的方法可能是有用的,比如通过人工神经网络嵌入单词。你知道吗
你首先应该想到的是“我想解决什么问题?”或者“我想回答什么问题?”一旦你有了它,你就可以定义一个目标函数来使用ML进行优化,或者你在尝试回答这些问题时找到了另一个范例来使用。你知道吗
相关问题 更多 >
编程相关推荐