从给定的url中提取顶级域(tld)。

tld的Python项目详细描述


从给定的url中提取顶级域(tld)。TLD名称列表是 取自Mozilla

可选地在非现有的TLD上引发异常或静默失败(如果 fail_silently参数设置为true)。

先决条件

  • python 2.7、3.4、3.5、3.6、3.7和pypy

文档

文档可在Read the Docs上找到。

安装

pypi上的最新稳定版本:

pip install tld

或github的最新稳定版本:

pip install https://github.com/barseghyanartur/tld/archive/stable.tar.gz

或BitBucket的最新稳定版本:

pip install https://bitbucket.org/barseghyanartur/tld/get/stable.tar.gz

用法示例

除了下面的示例之外,请参见jupyter notebook 工作簿文件。

从给定的url获取tld名称作为字符串
fromtldimportget_tldget_tld("http://www.google.co.uk")# 'co.uk'get_tld("http://www.google.idontexist",fail_silently=True)# None

获取tld作为an对象

fromtldimportget_tldres=get_tld("http://some.subdomain.google.co.uk",as_object=True)res# 'co.uk'res.subdomain# 'some.subdomain'res.domain# 'google'res.tld# 'co.uk'res.fld# 'google.co.uk'res.parsed_url# SplitResult(#     scheme='http',#     netloc='some.subdomain.google.co.uk',#     path='',#     query='',#     fragment=''# )

获取tld名称,忽略缺少的协议

fromtldimportget_tld,get_fldget_tld("www.google.co.uk",fix_protocol=True)# 'co.uk'get_fld("www.google.co.uk",fix_protocol=True)# 'google.co.uk'

将tld部件作为元组返回

fromtldimportparse_tldparse_tld('http://www.google.com')# 'com', 'google', 'www'

从给定的url获取第一级域名as string
fromtldimportget_fldget_fld("http://www.google.co.uk")# 'google.co.uk'get_fld("http://www.google.idontexist",fail_silently=True)# None

检查某些TLD是否为有效的TLD

fromtldimportis_tldis_tld('co.uk)# Trueis_tld('uk')# Trueis_tld('tld.doesnotexist')# Falseis_tld('www.google.com')# False

更新tld名称列表

要使用最新版本更新/同步tld名称,请运行以下命令 从您的终端:

update-tld-names

或者直接做:

fromtld.utilsimportupdate_tld_namesupdate_tld_names()

故障排除

如果以某种方式列出了域名here 无法识别,请确保您在 您的虚拟环境:

update-tld-names

测试

只需键入:

./runtests.py

或使用毒物:

tox

或使用毒性检查特定环境:

tox -e py36

编写文档

保持以下层次结构。

=====
title
=====

header
======

sub-header
----------

sub-sub-header
~~~~~~~~~~~~~~

sub-sub-sub-header
^^^^^^^^^^^^^^^^^^

sub-sub-sub-sub-header
++++++++++++++++++++++

sub-sub-sub-sub-sub-header
**************************

许可证

mpl 1.1/gpl 2.0/lgpl 2.1

支架

如有任何问题,请通过Author部分中提供的电子邮件与我联系。

作者

艺术酒吧<;artur.barseghyan@gmail.com>;

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java允许具有不同父类的类扩展类,而无需多重继承   java如何创建动态化的JScrollPane w/JPanel作为客户端?   java如何组织和命名包   在Java中读取属性文件   java无法解释的Android意图行为   在Java中动态执行多个BPEL文件的部署   ssl Java 6 SNI(服务器名称指示)?   java我们可以使用Robot框架自动化web和移动应用程序来执行并行执行   java for star pettern的循环   java为什么BinaryReader在线程中,从netty读取错误的数据包?   在java中将华氏度转换为摄氏度   使用Spark和java处理空值和引号编写CSV文件   Java中已排序日期到块的列表   visual studio代码VSCode Java不是linting或自动完成局部变量,而是自动完成Java快捷方式,如“sysout”