在python和条件上编辑txt文件?

2024-05-23 18:27:46 发布

您现在位置:Python中文网/ 问答频道 /正文

创建一个txt文件,插入任何英文文章 维基百科。执行以下操作:

  • 逐行读取文件

  • 将非空行添加到列表中

  • 从每行中删除所有数字、标点符号、括号、, 引文等

  • 使用join方法和空格将列表中的所有字符串合并为一个字符串, 作为分离器

  • 创建{“word”:quantity,“word”:quantity}形式的字典 计算不同单词的数量,其中键是唯一的单词,以及 价值-数量

  • 使用以下命令按降序显示10个最常用的单词 格式化方法(输出:“1个位置---太阳---15次\n….”)

  • 将该行中的所有这些单词替换为“PYTHON”

  • 创建一个新的txt文件

  • 在文件中写入一行,在每一行上分成几行 写不超过100个字符,不要分词。 代码

    进口稀土

    f=打开('wiki_text.txt','r')

    text=str(f.readlines())

    #打印(“%s\n”%text)

    words=re.findall('[a-zA-Z]{2,}',text)

    #打印(“%s\n”%words)

    stats={}

    对于w,大写:

      stats[w] = stats.get(w,0) + 1
    

    打印(统计)

    w_ranks=sorted(stats.items(),key=lambda x:x[1],\

        reverse=True) [0:10]
    
      print(w_ranks)
    
      _wrex = re.findall('[a-zA-Z]+',str(w_ranks))
    
      _drex = re.findall('[0-9]+',str(w_ranks))
    
      pl = [p for p in range(1,11)]
    
      for j in range(len(_wrex)):
    
          places = '{} place,{} - {} times'.format(pl[j],_wrex[j],_drex[j])
    
          print(places)
    

Tags: 文件方法字符串textretxt列表stats