解决下载文件名乱码

今天作文件下载功能模块,发现几个问题。git

1.    若是指定的文件名里包含了空格,FireFox就会截取空格前的部分做为默认文件名,IE就会在空格位置经过+号填补web

2.    中文字符乱码,准确的是非 ASCII 字符乱码,当原文件的文件名中含有非 ASCII 字符时,将引起客户端获取到的文件名错乱浏览器

3.     一些特殊字符不能被正常输出(固然这里我并非那些不常见的符号)好比“.”在IE下就会变为“[1].app

 

对于这三个问题,网上解决方案已经不少了,但没有一个完整的能够解决这些问题测试

要不就是解决了空格问题,但若是有中文了,就出现了乱码。要不就是解决了中文了,空格就变成“+”了等等………ui

有人说解决第一个问题解决方法很简单:用双引号把文件名括起来:google

 Response.AppendHeader("Content-Disposition", "attachment; filename=\"" + fileName + "\"");
Response.ContentType
= "application/octet-stream";

这样作仍是会有问题的,IE,若是文件名包含两个'.'的话,它会在第一个点前自动加个"[1]",因而你原来的文件名"Microsoft.App.zip"就变成了" Microsoft[1].App.zip "编码

出现这个问题的缘由是微软IE中的BUG(微软的说明 )spa

对于这个BUG,能够经过下面的方法解决code

复制代码

1 if (Request.Browser.Browser.Contains("IE"))
2 {
3 string ext = fileName.Substring(fileName.LastIndexOf('.'));
4 string name = fileName.Remove(fileName.Length - ext.Length);
5     name = name.Replace(".", "%2e");
6    fileName = name + ext;
7 }
8 Response.AppendHeader("Content-Disposition", "attachment; filename=\"" + fileName + "\"");
9 Response.ContentType = "application/octet-stream";

复制代码

但这样解决的前提是文件名称中不能有中文,仍是颇有局限性啊。

到这是估计有人想说了,为什么不用URL编码文件名称(HttpUtility.UrlEncode(fileName , System.Text.Encoding.UTF8)))。这个我最先的时候就试过了,经过编码后,空格所有成了+号了,固然这样作也就是解决了中文乱码问题,结果显示的仍是很不满意

最后经过google,终于找到老外的一编文章:Display a non-US-ASCII filename in File Download dialog box

如下是他的代码

复制代码

 1        string encodefileName=ToHexString(fileName);       //使用自定义的    Response.AppendHeader("content-disposition", "attachment;filename=" + encodefileName);
2 /// <summary>
3 /// 为字符串中的非英文字符编码Encodes non-US-ASCII characters in a string.
4 /// </summary>
5 /// <param name="s"></param>
6 /// <returns></returns>
7 public static string ToHexString(string s)
8    {
9 char[] chars = s.ToCharArray();
10        StringBuilder builder = new StringBuilder();
11 for (int index = 0; index < chars.Length; index++)
12        {
13 bool needToEncode = NeedToEncode(chars[index]);
14 if (needToEncode)
15            {
16 string encodedString = ToHexString(chars[index]);
17                builder.Append(encodedString);
18            }
19 else
20            {
21                builder.Append(chars[index]);
22            }
23        }
24 return builder.ToString();
25    }
26 /// <summary>
27 ///指定一个字符是否应该被编码 Determines if the character needs to be encoded.
28 /// </summary>
29 /// <param name="chr"></param>
30 /// <returns></returns>
31 private static bool NeedToEncode(char chr)
32    {
33 string reservedChars = "$-_.+!*'(),@=&";
34 if (chr > 127)
35 return true;
36 if (char.IsLetterOrDigit(chr) || reservedChars.IndexOf(chr) >= 0)
37 return false;
38 return true;
39    }
40 /// <summary>
41 /// 为非英文字符串编码Encodes a non-US-ASCII character.
42 /// </summary>
43 /// <param name="chr"></param>
44 /// <returns></returns>
45 private static string ToHexString(char chr)
46    {
47        UTF8Encoding utf8 = new UTF8Encoding();
48 byte[] encodedBytes = utf8.GetBytes(chr.ToString());
49        StringBuilder builder = new StringBuilder();
50 for (int index = 0; index < encodedBytes.Length; index++)
51        {
52            builder.AppendFormat("%{0}", Convert.ToString(encodedBytes[index], 16));
53        }
54 return builder.ToString();
55    }

复制代码

经过他这段代码,咱们能够解决掉两个问题,一个是中文乱码问题,还有一个是文件名中出现空格的问题,但第三个问题还在困扰着咱们,这该怎么办了。难道真的没有完美的解决办法吗?
答案是否认的,咱们经过以上代码的总结,会发现,将其稍微结合一下,这三个问题就都迎刃而解了。

如下是我给出的解决方案:

复制代码

 1  string encodefileName=ToHexString(fileName);       //使用自定义的
2 if (Request.Browser.Browser.Contains("IE"))
3    {
4 string ext = encodefileName.Substring(encodefileName.LastIndexOf('.'));//获得扩展名
5 string name = encodefileName.Remove(encodefileName.Length - ext.Length);//获得文件名称
6        name = name.Replace(".", "%2e"); //关键代码
7        fileName = name + ext;
8    }
9 else
10    {
11        filename = encodefileName;
12    }
13    Response.AppendHeader("content-disposition", "attachment;filename=" + fileName );

复制代码

经过这样处理之后,无论是什么样的文件名称均可以解决掉乱码问题。该方式以经过测试,相似于“中国.黑客 Doc.v1.0.zip”这类文件名,IE,Chrome测试无压力,其它还未测试。若是有兴趣你们能够在各类浏览器上测试一下。还请你们多提意见!

相关文章
相关标签/搜索