抖音短链需通过JS跳转,服务端请求仅获含JS的HTML而无法执行跳转;PHP可用正则提取JS中的URL并解码校验,但遇混淆或反爬时应调用Puppeteer等浏览器环境解析。
file_get_contents 或 cURL 获取跳转目标?因为抖音的短链(如 https://v.douyin.com/iSxYabc/)本质是前端 JS 跳转,服务端返回的 HTML 中不包含真实 URL,而是内嵌一段 JS 执行 window.location.href 或 location.replace()。直接发 HTTP 请求只会拿到含跳转逻辑的 HTML,不会触发 JS 重定向。
核心思路:获取响应头中的 Location(适用于 301/302),或解析 HTML 中的 JS 跳转逻辑(适用于 200 + JS)。抖音目前主要用后者,需提取 JS 字符串里的 URL。
cURL 获取页面
HTML,务必设置 CURLOPT_FOLLOWLOCATION => false ,否则 cURL 会自动跟随跳转,拿不到原始 HTMLlocation\.href\s*=\s*["']([^"']+)["'] 或 window\.location\.replace\(["']([^"']+)["']\)
%3A%2F%2F),需用 urldecode() 解码后再 filter_var(..., FILTER_VALIDATE_URL) 校验
$shortUrl = 'https://v.douyin.com/iSxYabc/';
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $shortUrl);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, false); // 关键:禁用自动跳转
curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (iPhone; CPU iPhone OS 16_0 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Mobile/15E148 MicroMessenger/8.0.46(0x18002e37) NetType/WIFI Language/zh_CN');
$html = curl_exec($ch);
curl_close($ch);
// 提取 location.href = "xxx"
if (preg_match('/location\.href\s*=\s*["\']([^"\']+)["\']/i', $html, $matches)) {
$realUrl = urldecode($matches[1]);
if (filter_var($realUrl, FILTER_VALIDATE_URL)) {
echo $realUrl;
}
}
当遇到动态生成、混淆、防爬验证(如验证码、滑块)时,纯 PHP 正则基本失效。此时应交由真正浏览器环境处理。
browserless/chrome Docker 镜像),暴露 HTTP 接口file_get_contents 或 cURL POST 到 http://localhost:3000/execute,传入脚本:await page.goto("https://v.douyin.com/xxx/", { waitUntil: "networkidle0" }); return page.url();
USERAGENT、accept-language、禁用 headless(或使用 --no-sandbox)都影响成功率modal_id、share_source、share_uid)抖音分享页 URL(如 https://www.douyin.com/video/73xxxx?modal_id=73xxxx&share_source=copy_link)中,modal_id 是视频唯一 ID,share_source 表示分享渠道,这些参数通常保留在最终跳转后的 URL query string 中。
parse_url() + parse_str() 提取 query 参数modal_id 一般对应视频 ID,可直接用于调用抖音开放平台接口(如有权限)share_uid 和 share_user_id 不一定稳定存在,部分分享链路会抹除,不可依赖?(如 ?from=xxx?modal_id=...),需先清理非法 query 分隔符再解析$parsed = parse_url($realUrl); parse_str($parsed['query'] ?? '', $queryParams); $videoId = $queryParams['modal_id'] ?? null; $shareSource = $queryParams['share_source'] ?? 'unknown';抖音短链还原不是单纯的 HTTP 跳转问题,它混合了前端路由、反爬策略和动态渲染。正则能应付简单场景,但一旦页面结构变化或加入轻量混淆,就容易失效。真正稳定的方案,得接受「用浏览器跑 JS」这个事实——PHP 本身不执行 JS,别试图在服务端完全模拟。