网络爬虫的代码有什么问题？

def web(): n=0 a=open('quora.txt', 'r') #I've saved it as a txt file in my system b=a.read() startlink=0 while(n<10): startlink=b.find('<a href=', startlink+1) startquote=b.find('"', startlink) endquote=b.find('"', startquote) url=b[startquote+1:endquote] print url, startlink, startquote, endquote n=n+1

1条回答

网友

1楼 · 发布于 2024-06-12 05:26:30

结束引号的搜索应在开始引号位置后的一个字符开始：

def web():
    n = 0
    a = open('quora.txt', 'r') #I've saved it as a txt file in my system
    b = a.read()
    startlink = 0
    while (n < 10):
        startlink = b.find('<a href=', startlink + 1)
        startquote = b.find('"', startlink)
        endquote = b.find('"', startquote + 1)
        url = b[startquote + 1:endquote]
        print url, startlink, startquote, endquote
        n = n + 1

因为现在它也和endquote的startquote匹配

编程相关推荐

创建返回java测试结果的selenium测试方法
java Play2长期socket连接和多线程
java Spring引导Soap web服务创建Jaxb2插件错误
编译器构造如何将三地址码（TAC）转换为Java字节码？
java（泛型）无法对非静态类型T进行静态引用
java Kafka如何向多消费者发送消息
具有复杂类型的动态属性的java Odata
java Apache HttpClient线程
${catalina.base}/lib子目录中的java属性文件解析
JApplet上的java分层对象（扩展JComponet）

相关问题更多 >

编程相关推荐

热门问题

热门文章

网络爬虫的代码有什么问题？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >