如何通过一个文件的下载链接(url)获取到需要下载的文件名称是我们经常要遇到的一个问题。本文提供两种解决办法,基本上这两种解决办法结合可以处理大部分情况。
一、获取header字段Content-Disposition
Content-disposition 是 MIME 协议的扩展,MIME 协议指示 MIME 用户代理如何显示附加的文件。Content-disposition其实可以控制用户请求所得的内容存为一个文件的时候提供一个默认的文件名,文件直接在浏览器上显示或者在访问时弹出文件下载对话框。
该字段包含了两种返回值:
1、inline:将文件内容直接显示在页面
Content-Disposition: inline;filename=hello.jpg
2、attachment:弹出对话框让用户下载
Content-Disposition: attachment;filename=hello.jpg
可以看出无论是哪种返回值,其中都包括了filename,“=”后面就是我们需要的文件名称。
这里会出现一个问题,获取到的文件名称可能会出现中文乱码的情况。
具体原因可查看:https://blog.robotshell.org/2012/deal-with-http-header-encoding-for-file-download/
二、通过Url.getFile()获取
Url中的file属性是url对应的文件名部分,将获取到的file值进行解码,截取最后的部分即可。
getFile() && getPath()
getFile() = getPath() + getQuery()
file等于path和query两个字段值相加,存在query为空的情况
比如说:https://dldir1.qq.com/qqfile/qq/TIM2.3.2/21173/TIM2.3.2.21173.exe
url.getFile() : /qqfile/qq/TIM2.3.2/21173/TIM2.3.2.21173.exe
因为路径中不包含中文,因此你可以看得“懂”,如果路径中包含中文,此处需要将获得值进行解码。
可以看出最后的值“TIM2.3.2.21173.exe”就是我们需要的文件名称。
三、简单实现
public static String getUrlName(String fileUrl) {
String fileName = "";
try {
URL url = new URL(fileUrl);
HttpURLConnection conn = (HttpURLConnection) url.openConnection();
conn.setRequestMethod("GET");
conn.connect();
// 方法一
String raw = conn.getHeaderField("Content-Disposition");
if (raw != null && raw.indexOf("=") > 0) {
fileName = raw.split("=")[1];
fileName = new String(fileName.getBytes(StandardCharsets.ISO_8859_1), StandardCharsets.UTF_8);
}
// 方法二
String newUrl = conn.getURL().getFile();
if (newUrl == null || newUrl.length() <= 0) {
newUrl = java.net.URLDecoder.decode(newUrl, "UTF-8");
int pos = newUrl.indexOf('?');
if (pos > 0) {
newUrl = newUrl.substring(0, pos);
}
pos = newUrl.lastIndexOf('/');
fileName = newUrl.substring(pos + 1);
}
} catch (Exception e) {
e.printStackTrace();
}
return fileName;
}