如何在python中从文本文件中获取基本url？

wikimapia.org/1649944/Bahawalpur-Railway-Station panoramio.com/photo/84118355 wikimapia.org/1649944/Bahawalpur-Railway-Station nativepakistan.com/photos-of-bahawalpur defence.pk/threads/pictures-of-pakistan-railways.303027 nativepakistan.com/photos-of-bahawalpur panoramio.com/photo/51311162 https://hiveminer.com/User/Pakistan Rail Buff

1条回答

网友

1楼 · 发布于 2024-06-16 14:40:00

一种解决方案是：

^(?:\w+://)?.*?(?::\d+)?(?=/|$)

它匹配行的开头（^），后跟可选协议规范，例如https://（(?:\w+://)?）。然后它匹配任意数量的任何（.*?）直到一个可选的端口规范，比如:80（(?::\d+)?）。最后，它检查匹配后是否有一个/或行的结尾$（psitive look ahead (?=/|$)）。你知道吗

Check it out here at regex101。你知道吗

请注意，如果不想匹配端口部分，可以将其移到正面展望中。即^(?:\w+://)?.*?(?=(?::\d+)?(?:/|$))

编程相关推荐

java如何将异步类的结果放入mainActivity EditText
java LDAP目录管理器服务提供，OutOfMemory
java Cassandra NoHostAvailableException，但仍存在活动节点
springboot应用程序的java启动线程
如果poll不一定返回第一项，那么java是ConcurrentLinkedQueue的好选择吗？
解析XML时JSON中出现java意外字符串
当'key'是两个整数时，如何输出Java HashMap键？
java为什么不显示在jsp页面中
java使用流式API转换映射列表中的值
JavaJPA+Spring：基于在持久化实体之前接收到的值，将外键列映射到ID

相关问题更多 >

编程相关推荐

热门问题

热门文章