从网页中提取链接
Bun 的 HTMLRewriter API 可用于从 HTML 内容中高效提取链接。它通过将 CSS 选择器链式组合起来,以匹配你想处理的元素、文本和属性。下面是一个从网页中提取链接的示例。你可以向.transform 传入 Response、Blob 或 string。
将相对 URL 转换为绝对 URL
在爬取网站时,你通常希望将相对 URL(如/docs)转换为绝对 URL。以下是处理 URL 解析的方法:
完整的 HTML 转换文档请参见 文档 > API > HTMLRewriter 。