从网页中提取链接
Bun 的 HTMLRewriter API 可以高效地从 HTML 内容中提取链接。它通过串联 CSS 选择器来匹配你想处理的元素、文本和属性。这是一个从网页中提取链接的简单示例。你可以向.transform 传入 Response、Blob 或 string。
将相对 URL 转换为绝对 URL
在爬取网站时,你通常希望将相对 URL(如/docs)转换为绝对 URL。以下是处理 URL 解析的方法:
完整的 HTML 转换文档请参见 文档 > API > HTMLRewriter 。