解决下载文件名乱码

时间 2019-11-08

标签解决下载文件名乱码繁體版

原文原文链接

今天作文件下载功能模块，发现几个问题。git

1. 若是指定的文件名里包含了空格,FireFox就会截取空格前的部分做为默认文件名，IE就会在空格位置经过+号填补web

2. 中文字符乱码，准确的是非 ASCII 字符乱码，当原文件的文件名中含有非 ASCII 字符时，将引起客户端获取到的文件名错乱浏览器

3. 一些特殊字符不能被正常输出（固然这里我并非那些不常见的符号）好比“.”在IE下就会变为“[1].”app

对于这三个问题，网上解决方案已经不少了，但没有一个完整的能够解决这些问题测试

要不就是解决了空格问题，但若是有中文了，就出现了乱码。要不就是解决了中文了，空格就变成“+”了等等………ui

有人说解决第一个问题解决方法很简单:用双引号把文件名括起来:google

 Response.AppendHeader("Content-Disposition", "attachment; filename=\"" + fileName + "\"");
Response.ContentType = "application/octet-stream";

这样作仍是会有问题的,在IE中,若是文件名包含两个'.'的话,它会在第一个点前自动加个"[1]",因而你原来的文件名"Microsoft.App.zip"就变成了" Microsoft[1].App.zip "编码

出现这个问题的缘由是微软IE中的BUG（微软的说明）spa

对于这个BUG，能够经过下面的方法解决code

1 if (Request.Browser.Browser.Contains("IE"))
2 {
3  string ext = fileName.Substring(fileName.LastIndexOf('.'));
4  string name = fileName.Remove(fileName.Length - ext.Length);
5      name = name.Replace(".", "%2e");
6      fileName = name + ext;
7 }
8 Response.AppendHeader("Content-Disposition", "attachment; filename=\"" + fileName + "\"");
9 Response.ContentType = "application/octet-stream";

但这样解决的前提是文件名称中不能有中文，仍是颇有局限性啊。

到这是估计有人想说了，为什么不用URL编码文件名称（HttpUtility.UrlEncode(fileName , System.Text.Encoding.UTF8))）。这个我最先的时候就试过了，经过编码后，空格所有成了+号了，固然这样作也就是解决了中文乱码问题，结果显示的仍是很不满意

最后经过google,终于找到老外的一编文章：Display a non-US-ASCII filename in File Download dialog box

如下是他的代码

 1        string encodefileName=ToHexString(fileName);       //使用自定义的    Response.AppendHeader("content-disposition", "attachment;filename=" + encodefileName);
 2  /// <summary>
 3  /// 为字符串中的非英文字符编码Encodes non-US-ASCII characters in a string.
 4  /// </summary>
 5  /// <param name="s"></param>
 6  /// <returns></returns>
 7  public static string ToHexString(string s)
 8     {
 9  char[] chars = s.ToCharArray();
10         StringBuilder builder = new StringBuilder();
11  for (int index = 0; index < chars.Length; index++)
12         {
13  bool needToEncode = NeedToEncode(chars[index]);
14  if (needToEncode)
15             {
16  string encodedString = ToHexString(chars[index]);
17                 builder.Append(encodedString);
18             }
19  else
20             {
21                 builder.Append(chars[index]);
22             }
23         }
24  return builder.ToString();
25     }
26  /// <summary>
27  ///指定一个字符是否应该被编码 Determines if the character needs to be encoded.
28  /// </summary>
29  /// <param name="chr"></param>
30  /// <returns></returns>
31  private static bool NeedToEncode(char chr)
32     {
33  string reservedChars = "$-_.+!*'(),@=&";
34  if (chr > 127)
35  return true;
36  if (char.IsLetterOrDigit(chr) || reservedChars.IndexOf(chr) >= 0)
37  return false;
38  return true;
39     }
40  /// <summary>
41  /// 为非英文字符串编码Encodes a non-US-ASCII character.
42  /// </summary>
43  /// <param name="chr"></param>
44  /// <returns></returns>
45  private static string ToHexString(char chr)
46     {
47         UTF8Encoding utf8 = new UTF8Encoding();
48  byte[] encodedBytes = utf8.GetBytes(chr.ToString());
49         StringBuilder builder = new StringBuilder();
50  for (int index = 0; index < encodedBytes.Length; index++)
51         {
52             builder.AppendFormat("%{0}", Convert.ToString(encodedBytes[index], 16));
53         }
54  return builder.ToString();
55     }

经过他这段代码，咱们能够解决掉两个问题，一个是中文乱码问题，还有一个是文件名中出现空格的问题，但第三个问题还在困扰着咱们，这该怎么办了。难道真的没有完美的解决办法吗？
答案是否认的，咱们经过以上代码的总结，会发现，将其稍微结合一下，这三个问题就都迎刃而解了。

如下是我给出的解决方案：

 1  string encodefileName=ToHexString(fileName);       //使用自定义的
 2  if (Request.Browser.Browser.Contains("IE"))
 3     {
 4  string ext = encodefileName.Substring(encodefileName.LastIndexOf('.'));//获得扩展名
 5  string name = encodefileName.Remove(encodefileName.Length - ext.Length);//获得文件名称
 6         name = name.Replace(".", "%2e"); //关键代码
 7         fileName = name + ext;
 8     }
 9  else
10     {
11         filename = encodefileName;
12     }
13     Response.AppendHeader("content-disposition", "attachment;filename=" + fileName );

经过这样处理之后，无论是什么样的文件名称均可以解决掉乱码问题。该方式以经过测试，相似于“中国.黑客 Doc.v1.0.zip”这类文件名，IE,Chrome测试无压力，其它还未测试。若是有兴趣你们能够在各类浏览器上测试一下。还请你们多提意见！