为什么后端传来的JSON，前端无法正确解析

前端在解析后端传来的JSON数据时，之所以会频繁地出现无法正确解析的错误，其最核心、最普遍的原因在于后端所输出的“字符串”，并未能严格地、完整地，遵循JSON（JavaScript 对象表示法）这种“数据格式”的“语法规范”。尽管一个字符串，在人眼看来，可能与一个合法的JSON极其相似，但对于程序中“六亲不认”的解析器而言，哪怕只是一个多余的逗号、一对被误用的单引号、或一个未被转义的特殊字符，都足以构成一次“致命”的语法破坏。

导致解析失败的五大“元凶”通常涵盖：后端输出的字符串“不符合”严格的JSON语法规范、网络传输响应头的“内容类型”设置错误、响应体中包含了“非JSON”的额外内容、前后端对数据的“字符编码”不一致、以及前端在处理响应时“逻辑”本身存在缺陷。其中，后端输出的字符串不符合严格的JSON语法规范，是绝大多数解析失败的直接原因。

一、问题的“本质”、一份“严苛”的数据合同

要深刻地理解解析为何会失败，我们必须首先，在理念上，对**JSON**这种数据格式，建立一个精准的认知。

1. JSON是什么？

JSON，全称为“JavaScript 对象表示法”，它是一种轻量级的、基于文本的、语言无关的“数据交换格式”。它并非一种编程语言，而是一种被设计用来，在不同系统、不同语言之间，进行结构化数据传输的“通用语言”或“数据合同”。

2. “严格”是其“通用性”的前提

JSON之所以能够在今天的软件世界中，获得如此巨大的成功，并成为事实上的数据交换标准，其根本，就在于它极其简单、极其有限、也极其严格的“语法规则”。正是因为这份“简单而严苛”的合同，才使得，无论是Java, Python, C#, Go还是任何其他编程语言，都能够，轻易地，构建出一个能够100%准确理解和生成这份“合同”的“解析器”。

3. 机器的“零容忍”

一个程序的“解析器”，与人类的“大脑”，其工作方式，截然不同。

人类的大脑，在阅读一段有微小错误的文本时，具备强大的“容错”和“意图推断”能力。

程序的解析器，则是一个没有丝毫“容错”能力的、极其“执拗”的“状态机”。它会逐一地，读取每一个字符，并严格地，依据预设的“语法规则”，来判断下一个字符，是否是它所“期望”的。一旦，它遇到的字符，不符合其在当前状态下的“期望”，整个解析过程，就会立即“失败”，并抛出一个“语法错误”的异常。

因此，不读文档、凭感觉生成的、看似“差不多”的“类JSON”字符串，在严谨的解析器面前，其命运，只有“失败”。

二、元凶一、后端输出的“语法”错误

这是导致解析失败的、最高频、也最“低级”的一类错误。它们源于后端开发者，在生成JSON字符串时，违反了其最基本的语法规定。

1. 引号的“误用”

JSON的官方规范，明确地、强制性地规定：所有的“键”（key）和“字符串类型的值”（string value），都必须，使用“双引号” " 来包裹。

错误的写法（使用了单引号）： {'name': '张三', 'age': 30}

正确的写法： {"name": "张三", "age": 30} 对于许多习惯于在Python或JavaScript中，更自由地使用单引号的开发者而言，这是最容易犯的一个错误。

2. 逗号的“爱恨情仇”

逗号，在JSON中，扮演着“分隔”同级元素（对象的属性、或数组的成员）的角色。对它的错误使用，主要有两种情况：

致命的“尾随逗号”： {"name": "张三", "age": 30,} 在对象的最后一个属性"age": 30之后，多了一个不该存在的“尾随逗号”。虽然，在现代JavaScript的对象字面量中，这种写法，常常是被允许的。但是，在严格的JSON标准中，这是绝对不合法的。

缺失的“分隔逗号”： {"name": "张三" "age": 30} 在两个属性之间，忘记了，用逗号，进行分隔。

3. 特殊字符的“逃逸”

如果一个“字符串的值”，其本身，就包含了双引号、反斜杠等，在JSON语法中，具有特殊意义的“控制字符”，那么，这些字符，就必须，进行“转义”。

错误的写法： {"motto": "他说："你好，世界！""}

问题分析：在他说：后面的那个双引号，会被解析器，错误地，认为是motto这个字符串值的“结束”，从而，导致后续的文本，都变成了非法的语法。

正确的写法： {"motto": "他说：\"你好，世界！\""}

4. 数据类型的“混淆”

JSON所支持的数据类型，是有限的，只包括对象、数组、字符串、数字、布尔值（true/false）和null。如果，后端的序列化程序，错误地，将一个语言特有的、JSON所不兼容的类型（例如，JavaScript中的undefined、一个函数、或一个日期对象），直接地，注入到了JSON字符串中，也会导致解析失败。

三、元凶二、通信协议的“误会”

有时，后端生成的JSON字符串本身，是完全合法的。但问题，出在了负责传输它的“网络通信协议”的配置上。

1. Content-Type响应头的“谎言”

在网络请求的响应中，有一个至关重要的“响应头”字段，名为Content-Type。它，是服务器，向浏览器，做出的一个关于“我这次返回给你的‘响应体’，其内容，到底是什么格式”的“官方声明”。

正确的声明：当后端，返回一个JSON字符串时，它必须，在响应头中，将Content-Type的值，设置为application/json。

前端的行为：当像axios这样的、现代的前端请求库，看到这个Content-Type时，它会“智能地”、自动地，在内部，调用JSON.parse()，来将返回的文本，解析为JavaScript对象。

问题的根源在于，服务器，说了“谎”。

场景：后端程序，因为一个未被捕获的内部错误（例如，数据库连接失败），而崩溃了。此时，Web服务器框架（例如，Nginx或Tomcat），可能会，自动地，接管这个错误的响应，并向前端，返回一个它自己默认的、HTML格式的“500 错误”页面。但是，这个响应的Content-Type头，可能，依然，是后端代码中，原先设定的application/json。

后果：前端的请求库，接收到了这个响应。它“信任”了这个Content-Type头，并满怀信心地，试图，去将那段HTML错误页面的文本，当作JSON来解析。其结果，必然是，抛出一个“意外的符号 ‘<’”（即HTML标签的开头）的语法错误。

2. 字符编码的“乱码”

如果，后端，使用了像GBK这样的非标准编码，来生成JSON字符串，但又没有，在Content-Type响应头中，明确地，通过charset=gbk来声明它，那么，浏览器，就会，默认地，按照UTF-8编码，来对这段二进制的响应体，进行解码。这个过程，就会产生“乱码”，并很可能，导致JSON解析的失败。

四、元凶三、响应体中的“杂质”

这类问题，非常隐蔽。即，后端返回的，确实是一个大部分内容都合法的JSON字符串，但在其“头部”或“尾部”，被意外地，混入了一些“非JSON”的“杂质”。

调试信息的“意外”输出：最常见的原因，是后端开发者，在代码中，遗留了一些用于“调试”的打印语句（例如，print("开始处理用户数据...")）。这些本应被删除的调试文本，被输出到了标准的响应流中，并被拼接在了JSON字符串的前面，从而，污染了整个响应体。

服务器框架的“警告”信息：一些配置不当的服务器端语言（如PHP），在遇到一些非致命的“警告”时，可能会，将其警告信息，以HTML的格式，直接“渲染”到响应内容的顶部。

五、如何系统性地“诊断”与“预防”

1. 诊断工具箱

浏览器开发者工具：“网络”面板，是所有前后端接口调试的“第一案发现场”。

找到那条失败的请求。

点击它，并切换到“响应”标签页。

在这里，你可以看到，未经任何处理的、最原始的、服务器所返回的“响应体”文本。99%的语法问题，都可以在这里，通过肉眼，被识别出来。

接口测试工具：使用Postman等工具，可以，脱离前端代码的干扰，直接地，对接口，进行调用和测试。

在线JSON校验器：将从“响应”标签页中，复制出的原始文本，粘贴到任何一个在线的JSON校验器中，它会立即地，以一种非常精准的方式，告诉你，语法错误，具体发生在哪一行、哪个字符。

2. 预防策略

后端：使用健壮的JSON序列化库：永远不要，手动地，去拼接JSON字符串。必须，使用你所用语言中，经过了充分测试的、主流的JSON序列化库（例如，Java中的Gson或Jackson，Python中的json模块）。这些库，会为你，自动地，处理好所有关于“引号”、“特殊字符转义”和“数据类型”的复杂细节。

后端：建立统一的响应结构：团队应约定，所有接口，都返回一个统一的、结构化的“响应包装”。例如：{ "success": boolean, "data": object|null, "error": { "code": number, "message": string }|null }。

前端：编写防御性的解析代码：永远不要，想当然地，认为，服务器返回的，就一定是，一个合法的JSON。所有对响应体的JSON解析操作，都应被包裹在一个try...catch代码块中。JavaScriptfetch(...) .then(response => response.text()) // 先以纯文本方式，获取响应体 .then(text => { try { const data = JSON.parse(text); // ... 在这里，安全地，处理解析成功的数据 ... } catch (error) { // ... 在这里，处理JSON解析失败的情况 ... console.error("JSON解析失败！", "原始响应文本:", text); } });

协同：API设计规范与评审：前后端团队之间，必须，就接口的“数据合同”，达成一个清晰的、书面化的共识。

常见问答 (FAQ)

Q1: 为什么JSON格式要求这么严格，比如不能用单引号？

A1: JSON的“严格”，正是其“通用性”的根本保障。通过制定一套极其简单、有限、且无歧义的语法规则，它确保了，任何一种编程语言，都能够，轻易地，实现出一个能够100%与之兼容的解析器，从而，实现了数据的“跨语言、跨平台”的、无损的自由流通。

Q2: 我的浏览器“预览”标签页里能看到格式化的对象，为什么程序解析还是报错？

A2: 因为，浏览器的“预览”功能，常常，会使用一个更“宽容”的、类似于JavaScript对象字面量的解析器，来尽力地，“美化”和“格式化”它所接收到的文本。它，可能会，自动地，帮你修正一些微小的错误（例如，尾随逗号）。而你的程序代码中，所使用的JSON.parse()，则是一个严格的、遵循官方标准的解析器。

Q3: JSON.parse() 和一些库（如jQuery）的 parseJSON() 有什么区别？

A3: JSON.parse()是浏览器内置的、严格遵循JSON官方标准的解析器。而一些历史悠久的库中所提供的解析函数，为了兼容性，其行为，可能，会更“宽容”一些，其具体的解析规则，需要查阅该库的官方文档。在现代开发中，应无条件地，优先使用浏览器内置的JSON.parse()。

Q4: 如何处理一个可能包含超大数字的JSON，而不会丢失精度？

A4: 这是一个经典的JavaScript问题。因为JavaScript的Number类型，是基于“双精度浮点数”的，它无法，精确地，表示超出其安全整数范围的、大的整数。要解决这个问题，后端，在序列化这个大数字时，应将其，明确地，转换为“字符串”类型。前端，在接收到这个“数字字符串”后，应使用像BigInt或第三方的高精度计算库，来进行后续的处理。

文章包含AI辅助创作，作者：mayue，如若转载，请注明出处：https://docs.pingcode.com/baike/5215151