r语言-42 ajax 下载文件未配置 responseType blob 导致的文件异常

前言

这是一个最近的关于文件下载碰到的一个问题

主要的情况是, 基于 xhr 发送请求, 获取下载的文件

然后之后 xhr 这边拿到字节序列之后, 封装 blob 来进行下载

然后最开始我们这边没有配置 responseType 为 blob, arraybuffer, 然后导致下载出来的文件大小超过了一倍,m 并且解压出现了问题

然后增加了 responseType 配置为 blob 之后, 文件下载的功能就正常了

这里来大致看一下大体的一个情况, 因为 xhr 这边具体的编码 response, responseText, responseXml 的代码查看不了, 因此看不到字节序列转换为字符串的过程, 因此这里的结论仅仅是一个大致的推导

另外 js 这边 new Blob 的具体的代码也是查看不了, 因此查看不了字符串转换为字节序列的这个过程

测试用例

客户端这边发送请求的 demo 代码如下

  ajax({
    method: 'post',
    url: '/xxx/file/batchDownload',
    data: data,
    // responseType: 'arraybuffer'
  }).then(res => {
	let blob = new Blob([res], {type: "application/zip"});
	const link = document.createElement("a");
	link.download = 'file.zip';
	link.style.display = "none";
	link.href = URL.createObjectURL(blob);
	document.body.appendChild(link);
	link.click();
	URL.revokeObjectURL(link.href);
	document.body.removeChild(link);
  }).finally(() => {
	this.setdownLoading(row, false)
  })

正常的情况

如下是一个列表展示, 原始正确的 zip 文件大小为 811667 字节

// 原始文件大小 
blob 
	811667 
	
// 原始字节序列 使用给定的编码编码为字符序列, 然后再使用相同的编码解码为字节序列 
new String(baos.toByteArray(), $charset).getBytes($charset)
	gbk : 810632 
	utf8 : 1475674 

// 前端 xhr 代码中不配置 responseType 为 arraybuffer/blob 的情况 
xhr, without responseType blob, new Blob([res], {type: "application/zip"});
1476964

服务器这边响应的正常的 zip 文件大小如下, 是正确的, 可以正常打开

然后我们看一下正常的情况, 即 ajax 增加 responseType 为 blob/arraybuffer 的情况

这里是 axios 中的基于 xhr 的一个适配器, 这里是具体的基于 XmlHttpRequest 发送请求的地方

我们可以看到 response 为 blob, 然后字节数为 811667 拿到的是正常的数据

然后进而再外层业务 handle 处理的时候也是拿到的正确的数据

然后最终下载的压缩包, 正常

异常的情况

然后这里可以看到的是 responseData 是一个字符串, 说明他已经被转换过了

因为服务器那边传输的是原始的字节序列, 然后这里被转换过了之后可能会造成字节序列的数据丢失, 错误

可以看到这里数据大小是 1.5M 大概是原始数据的两倍, 字节转字符的编码可能是 gbk 或者 utf8

然后业务这边再根据字符串传唤为字节序列, 存放到 blob, 拿到的也是一个错误的数据

可以看到这里数据量大小为 1476944 和上面表格统计的大小基本一致, 之所以说基本一致, 是因为多次下载会有少许不同, 大小差距在 20字节左右

所以综上问题就在于在这个字节序列转字符序列再转字节序列的过程中造成了数据的错误

这个过程会经过两次字符编码体系的处理

如果这两次都是相同的单字节编码, 那么不会出现问题
如果是两次都是相同的多字节编码则可能存在问题, 因为目标字节序列可能未必复合目标编码的格式约束, 然后造成了数据的不可逆丢失
如果是两次是不同的编码, 并且存在兼容的 codepoint, 而且字节序列中的数据均在这些兼容的 codepoint 范围内, 则不会出现问题, 否则会出现数据错误

但是目标字节序列, 是 zip 格式, 任何一个字节的错误都可能造成整体文件不符合 zip 的规范, 或者最开始验签的时候就校验不通过

字节序列使用 utf8编码转换为字符串, 然后再依据utf8编码转换为字节序列, 数据会不会丢失?

// 原始文件大小 
blob 
	811667 
	
// 原始字节序列 使用给定的编码编码为字符序列, 然后再使用相同的编码解码为字节序列 
new String(baos.toByteArray(), $charset).getBytes($charset)
	gbk : 810632 
	utf8 : 1475674

这里我们先来看下这里例子中的文件的情况, 这里就解释了不配置 responseType 为 arraybuffer/blob 的情况下下载出来的数据是错误的问题

使用 utf8 的时候, 整个过程最终结果的字节序列长度为 1475674

使用 gbk 的时候, 整个过程最终结果的字节序列长度为 810632

然后我们这里来看拿一下上面的转换之后, 什么情况下数据会丢失? 什么情况下数据不丢失?

如果字节序列是满足 utf8 的编码规范, 则数据不会丢失, 否则可能会有数据丢失

比如这里是原始字节序列不满足 utf8 的编码规范, 然后造成了数据的丢失, 原始仅仅有 6 个字节, 转换之后却有 18 个字节, 并且数据还存在错误

比如这里是原始字节序列满足 utf8 的编码规范, 然后可以看到的是原始字节序列和目标字节序列是相同的

但是我们的目标文件是一个 zip 格式的二进制文件, 我们不能确保它的字节序列满足固定的字符编码[假设浏览器这边是以 utf8 进行编码解码]

所以如果是存在一个这个转换过程的话, 是可能存在字节序列的数据的错误, 丢失

进而导致下载下来的文件, zip 解压缩软件识别出错

完

更多【r语言-42 ajax 下载文件未配置 responseType blob 导致的文件异常】相关视频教程：www.yxfzedu.com

r语言-42 ajax 下载文件未配置 responseType blob 导致的文件异常

前言

测试用例

正常的情况

异常的情况

字节序列使用 utf8编码转换为字符串, 然后再依据utf8编码转换为字节序列, 数据会不会丢失?

相关文章推荐

Markdown Editor

友情链接

课程目录

技术交流QQ群

r语言-42 ajax 下载文件未配置 responseType blob 导致的文件异常

前言

测试用例

正常的情况

异常的情况

字节序列 使用 utf8编码转换为字符串, 然后再依据utf8编码转换为字节序列, 数据会不会丢失?

相关文章推荐

Markdown Editor

友情链接

课程目录

技术交流QQ群

字节序列使用 utf8编码转换为字符串, 然后再依据utf8编码转换为字节序列, 数据会不会丢失?