编写一个小而灵活的HTTP客户端

2 投票

7 回答

2145 浏览

提问于 2025-04-16 07:18

我想了解大家是怎么写一个快速（小巧）但又灵活的HTTP客户端的。这里的“快速”是指代码量不多（具体多少你们自己决定），最好是使用语言自带的函数，而不是下载的或者自定义的库，这样只要对套接字编程有基本了解，就能明白代码是怎么工作的。“灵活”则是指你应该能够轻松处理接收到的数据。我自己写的一个类似的东西是：

#!/usr/bin/perl
use Socket;
use HTML::Parse;

socket(SOCKH, PF_INET, SOCK_STREAM, getprotobyname('tcp')) || die $!;
connect(SOCKH,sockaddr_in(80,inet_aton('www.example.com'))) || die $!;

$old_fh = select(SOCKH);
$|=1;
select($old_fh);

print SOCKH "GET / HTTP/1.0\n\n";

while (<SOCKH>) {
    $response .= $_;
}

print parse_html($response)->format;

close(<SOCKH>);

这只是一个快速的客户端，我很快会对它进行HTTP/1.1的编辑。如果你有建议可以让它更符合标准，请分享！

更新：这是我代码的更新版本，使用了LWP，正如Sinan Unur建议的那样：

#!/usr/bin/perl
use LWP::Simple;
use HTML::Parse;

$data = parse_html( get( 'www.example.com' ) )->format;
foreach $line ( $data ) {
    print $line; // or any other line-based operation
}

灵活性代码优化数据处理网络编程套接字编程轻量级设计 http客户端 http/1.1

7 个回答

跟@Santa的例子类似，这里是用Ruby写的：

require 'open-uri'
print open('http://www.example.com').read

如果你想解析内容，Ruby的Nokogiri这个库非常棒。它是基于libXML构建的。

还有很多其他的HTTP客户端库可以使用，比如HTTParty和Typhoeus。HTTParty让你轻松地为一个类添加REST功能，同时也能解析JSON和XML。Typhoeus则让你可以很方便地一次性发送多个请求，适合并行处理获取数据。

回答于 2025-04-16 由 Python大师

分享举报

Python自带了很多功能

你不需要直接处理网络连接的底层细节（当然你也可以这么做）。Python的标准库里有几个更高级的网络/http库，可以直接使用。

比如，在Python 2中，你可以使用urllib2：

import urllib2

response = urllib2.urlopen('http://www.example.com/')
html = response.read()

另外，你还可以看看httplib，它提供了稍微低一些级别的访问：

>>> import httplib
>>> conn = httplib.HTTPConnection("www.python.org")
>>> conn.request("GET", "/index.html")
>>> r1 = conn.getresponse()
>>> print r1.status, r1.reason
200 OK
>>> data1 = r1.read()
>>> conn.request("GET", "/parrot.spam")
>>> r2 = conn.getresponse()
>>> print r2.status, r2.reason
404 Not Found
>>> data2 = r2.read()
>>> conn.close()

回答于 2025-04-16 由 Python大师

分享举报

Perl有一个叫做LWP的工具。我建议你使用它。

回答于 2025-04-16 由 Python大师

分享举报

编写一个小而灵活的HTTP客户端

7 个回答

撰写回答