从10K提取SIC，CIK，创建元数据选项卡

1条回答

网友

1楼 · 发布于 2024-04-25 04:47:59

这里有一些我刚刚写的代码来做类似的事情。您可以将结果输出到CSV文件。作为第一步，您需要遍历该文件夹并获得所有10K的列表并在其上迭代。在

    year_end = ""
    sic = ""

    with open(txtfile, 'r', encoding='utf-8', errors='replace') as rawfile:
        for cnt, line in enumerate(rawfile):
            #print(line)
            if "CONFORMED PERIOD OF REPORT" in line:
                year_end = line[-9:-1]
                #print(year_end)
            if "STANDARD INDUSTRIAL CLASSIFICATION" in line:
                match = re.search(r"\d{4}", line)
                if match:
                    sic = match.group(0)
                    #print(sic)
                #print(sic)
            if (year_end and sic) or cnt > 100:
                #print(year_end, sic)
                break

编程相关推荐

多线程试图找出线程和Java
java字符串池（字符串和字符串缓冲区）
java如何通过entryid从kaltura获取文件url
java如何通过Oracle服务总线重定向请求
java RecyclerView我最多只能添加一行
java如何防止Paho在处理来自代理的消息后发送ACK？
java从泛型方法调用重载方法
java如何使javac编译我的多语言程序
java Log4j不会在删除时重新创建文件
java如何设置Zk会话（org.zkoss.Zk.ui），以便对扩展GenericForwardComposer的控制器类进行单元测试

相关问题更多 >

编程相关推荐

热门问题

热门文章

从10K提取SIC，CIK，创建元数据选项卡

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >