基于命名实体识别的自动文摘

2024-05-16 12:21:05 发布

您现在位置:Python中文网/ 问答频道 /正文

我想使用命名实体识别(NER)根据给定的数据集自动汇总机票。你知道吗

基本上这是我的数据集。你知道吗

enter image description here

在这里,我需要创建一个pdf格式的乘客详细信息摘要,如:

The PNR Number ____(PNRNum) refers to the passenger name ____(Name) travelling from ____(Dep Airport),____(Start Country) to ____(Arr Airport),____(End Country) starting at ____(Start Time). The flight number is ____(Flight No) which is _____(Int Dom) using _____(Cabin Class) ticket of base fare _____(Base Fare).

在这里,PNR编号应作为输入输入输入到第一个空格中,数据集的相应数据应填充到剩余的空格中。你知道吗

airline = pd.read_csv("AIR-LINE.csv")
def create_airline_ticket():
    c = canvas.Canvas('AIRlines.pdf')

    c.setFont("Courier", 20)
    c.drawCentredString(300, 700, 'Airline Ticket')
    c.setFont("Courier", 14)
    form = c.acroForm

    c.drawString(10, 650, 'The PNR Number')
    options = [('airline.loc[[0, 10], :]')]
    form.choice(name='choice1', tooltip='Field choice1',
                value='A',
                x=165, y=645, width=72, height=20,
                borderColor=magenta, fillColor=pink, 
                textColor=blue, forceBorder=True, options=options)

    c.save()

我考虑使用ReportLabs模块来使用其中的listbox。但并没有相应的进展。我得用别的方法。你知道吗

你能给我建议一个循序渐进的程序吗?因为我是python的初学者,所以学习起来很容易。谢谢。你知道吗


Tags: theto数据namenumberpdfisticket