从URL中提取信息。处理网络上的资源时,通常会需要得到资源的位置,统一资源标识符URI用于标识一个资源,而统一资源定位器URL是一种具体URI,不仅标识了一个资源,还指明了如何获得这个资源的位置。假设URL由protocol,host,port(可选)以及resource path四部分组成,且在一个具体的URL,http://example.com:80/page中,其对应关系如下:
protocol |
http |
host |
example.com |
port |
80 |
resource path |
page |
请写一个正则表达式,提取出URL中的protocol,host和port信息。该正则表达式应能正确匹配下表中的URL。
操作 |
URL |
捕获的组 |
捕获 |
ftp://file_server.com:21/top_secret/secret.pdf |
ftp,file_server.com,A4z100150满分答卷(100150.com)-青少年编程等级考试及竞赛题库 21 |
捕获 |
https://example.com/lesson/introduction#section |
https,A4z100150满分答卷(100150.com)-青少年编程等级考试及竞赛题库 example.com |
捕获 |
file://localhost:8080/zip_file |
file,localhost,A4z100150满分答卷(100150.com)-青少年编程等级考试及竞赛题库 8080 |
捕获 |
https://s3s3-server.com:9999/ |
https,s3s3-server.com,A4z100150满分答卷(100150.com)-青少年编程等级考试及竞赛题库 9999 |
捕获 |
market://search/angry%20birds |
market,A4z100150满分答卷(100150.com)-青少年编程等级考试及竞赛题库 search |
A4z100150满分答卷(100150.com)-青少年编程等级考试及竞赛题库 A4z100150满分答卷(100150.com)-青少年编程等级考试及竞赛题库