仅凭感官,如何识别AI生成的内容?

教程
2025-11-18 10:46
阅读33

image.png


目录

  1. 前言
  2. 辨别AI生成的图像、视频
  3. 甄别AI生成的音频
  4. 鉴别AI生成的文本
  5. 小结


今年双十一,竟然有不少人,为了骗商家“仅退款”,用AI来p图。

比如卖袜子的商家在网上怒斥某职校生买家用AI生成有质量问题的袜子。再比如有买了洗鼻器的男子,直接P了个图,给商家说,这个头有问题,结果商家放大图片一看,有AI水印(这哥们忘记p掉了)。

image.png

(左为袜子p图退款,右为洗鼻器p图退款)

AI不知何时,从单纯的好助理,变成了身兼数职的复杂角色——除任工作好秘书一职外,还任诈骗者的帮凶,混淆视听者的狗腿子。

对,屏幕前的你想的没错,坏的是人,不是AI。

不过幕后操控AI之人散落各方,要想解除他们带给我们的负面影响,还是对付AI生成内容的可操作性最强。而应对AI生成结果,第一步就是要辨别它。

为了帮助大家甄别信息真假、防止被诱导和被消费,本篇针对不同模态,教给大家一些快速辨别真伪的方法。


一、辨别AI生成的图像、视频

AI图像可以结合如下五个维度去判断:

一、看结构逻辑

其实就是人体五官和比例逻辑,物体、空间结构逻辑。这是AI最容易出错的地方。AI常见的异常有:

  • 身体问题。身体比例不协调,手臂过长、关节奇怪、姿势物理不合理。手部问题突出,表现为手指数量多或少,指尖融合,手部的三视图逻辑有误,手部变形。
  • 空间问题。就是距离和尺寸问题,具体表现为AI图像中的“长宽高(深)”基本是不可能三角,多人之间的距离、两(多)个物品的尺寸对比、两(多)个人物的身高对比不符合常理。
  • 背景问题。背景透视畸变、地平线弯曲、背景漂浮等。

二、看光影反射

这也是辨别大多数AI生图平台生成结果的重要方法,即便是数一数二的AI生图模型,也容易出现其中一方面的问题。

  • 光照方向。阴影方向矛盾、光照不对应。
  • 阴影边缘。阴影边缘形状与实物不一致,或者有物理错误。
  • 反光反射。镜面反射图像扭曲、不对应或缺失。金属/玻璃反光区域乱或模糊一片
  • 眼睛高光。高光位置不同、反射物怪异。

三、看材质细节

  • 纹理问题。人脸颜值高,人的皮肤平滑均匀、没什么瑕疵。金属、木头、植物纹理重复或对称分布。动物毛发整齐、过密或很模糊。
  • 对称问题。成对的物品,比如手套、耳环等,出现不对称或样式不同。
  • 背景问题。背景模糊不清、边界拉扯。

四、看文字符号

  • 文字书写。文字模糊、乱码、扭曲,英文拼写错误。
  • 文字排版。行距乱、伪拉丁文。

五、看整体氛围

  • 环境方面。光线梦幻、景深夸张、色调统一。
  • 风格方面。画面“像渲染”,没有拍摄噪点。

最重要的还是前三点。比如看阴影边缘和动物毛发:

image.png

(左为实拍,右为即梦4.0生成)

image.png

(左为实拍,右为即梦4.0生成)

即梦4.0生成的太阳没有外层轮廓,边缘分界不明,小狗脸上的毛发和胡须模糊。

image.png

(左为实拍,右为即梦4.0生成)

不过也有无法分辨的,比如上面湖景图。

当碰上图生图复刻能力和细节处理优秀的工具时,或者碰上梦幻唯美类的艺术图片时,就还是需要工具检测。比如国内的朱雀 AI 检测助手、Deepfake Defenders,国外的AI Image Detector、Undetectable AI Image Detector等。

视频的辨别方法在图像和音频方法的基础上多了如下两部分:

一、看一致性(百试百灵)

  • AI图片的主体(形象、面貌、装扮)、环境的构成元素和位置(静物)连续帧容易不一致。

二、看动态逻辑(百试百灵)

  • 面部动态。AI易嘴型不同步、眨眼频率很低、声画不同步等
  • 行为动态。AI大多难以生成短时变化多、大的动作视频,所以这种动作下的AI视频就显得动作不自然,比如快速切菜、武打、体育、抖腿等。

就比如这个真实和AI生成的对比视频,你能分辨出来哪个为真吗?

当然,我们网上看到的优质AI视频也能从中发现AI味儿,尽管它最大程度上绕开了上面说的AI问题。但它产生的新特点就是场景切换快、同框角色少、运镜有瑕疵,引导的视觉重心在剧情。

若实在分辨不出,或者提升辨别效率,可使用朱雀 AI 检测助手、DeepReal、Sensity AI等工具进行检测。


二、甄别AI生成的音频

相比音乐,普通人更能听出AI人声。AI人声没有呼吸声,语速四平八稳,停顿很有规律,情绪假或者根本就没有情绪波动,说的方言奇奇怪怪。

所以,这里重点讲区别AI音乐和人类制作音乐的方法。需要注意的是,这里所讲的方法还是更适合有乐理基础和音乐敏感人士哦~

方法如下:

一、听和声

  • AI音乐的和声过于结构化,失去了人类音乐中细微的不和谐感,听起来不自然。

二、听音乐片段

  • AI音乐容易出现出现“编曲突兀”的问题。
  • AI音乐容易出现插入不协调的编曲段落。
  • AI音乐容易出现“幽灵音效层”的问题。

这三个问题都是因为AI模型有难以规避的连贯性弱点,在构建长时序音乐时容易暴露。

三、听动态与情绪

  • 相比人类制作音乐,通常AI音乐的动态变化不大。有研究发现AI音乐的振幅标准差可能比人类音乐更小。
  • AI音乐可能缺乏人类作曲中那种层层递进的情感张力。

四、听人声

  • AI音乐中人声通常有电音,声音在音区转换平滑、情绪线条机械。
  • 人声“贴耳”、共鸣单一或无共鸣。
  • 人声无生理噪声,完全干净。
  • 之前提到的情感不足,演绎与词义脱节。

五、听空间与乐器

  • AI音乐大多无法体现声场定位,无法生成录音室、音乐厅等不同演绎场景的歌曲
  • AI音乐所用的乐器声可能没有层次感、共鸣和本身质感。

对于小白群体,若连听人声也无法鉴别,那么使用专业工具就是最佳方法。这类专业工具常见的有Resemble AI、Hiya Deepfake Voice Detector、SafeEar等。


三、鉴别AI生成的文本

因为甄别是为了规避被诱导、被消费、被骗的不利影响,所以下面不对“AI激发文本创意”作讨论,仅对讲求原创、需要保持客观真实的文本(大多来源于教育科研、文学艺术和传媒领域)作探讨。

这类文本大多篇幅较长(除诗词之外),我们可以从如下五个方面结合去判断:

一、看语言节奏

若提示词未经精雕细琢,AI生成的文本大多具有语气平稳、结构模板化、频繁使用逻辑连词、词汇和句式重复的特点。不过若文本本身就是说明性、研究性较强的文章,就需要结合其他维度判断。

二、看内容逻辑

  • 框架上,AI提炼的框架往往全面但重点不明;人工写作可能框架不全,但重点突出。
  • 内容上,AI写作无明显错误,但也深度不够;人工写作或可有歧义、语病的情况,但篇内也有明显所长之处。
  • 衔接上,AI容易在层次交接处出现生硬、衔接不通的问题,人工写作此情况较少。

三、看情绪、修辞(百试百灵)

  • AI写作一般语气单调,很少出现反问或感叹(除了小说之外);人工写作视体裁而定,语气可能有多样性(如叙事、抒情散文、小说等)。
  • AI写作难以正确运用修辞手法,可能出现滥用、应用不当的情况,更是不会运用反语、双关、隐喻等修辞手法,也不会正确表达幽默、讽刺等情绪。

四、看细节痕迹(百试百灵)

  • AI写作易出现细节逻辑问题,比如不符合现实行为规律、前后描述不一致等。
  • AI写作易出现语言夸张、夸大情况,衍生出违背现实的逻辑问题。
  • AI写作往往没有详实案例或案例不真实,往往数据有误、匮乏或缺失。

五、看个人风格

  • AI写作通常风格混杂,没有自己独特“标签”,即便是仿写文章,它也会削弱对方风格,添入自己的属性。

就比如我让Gemini写的散文《背影》(提示词见评论区)

image.png

(文由Gemini生成)

一句句细看后,我们能发现它有几个突出的问题:

送别场景重点不突出;有几处逻辑问题(父亲嘴上只说了不送,但母亲却劝他不送;一般深夜归来时视觉上看到的是正面而不是背影;2次提到“最后一次”);修辞太多;用词风格跨度大(近代、现代、二次元都有)。

不过细看耗时较多,且当碰上用AI生成、人工修改的文本时,区分就非常费力了。此时还是需要用上专业鉴别工具,比如朱雀 AI 检测助手、PaperYY、Papertime等。


四、小结

经过AI提示词的反复训练,AI生成文本、音频、图像和视频的结果会更逼真,不过无论如何逼真,只要抓住如下关键,就能快速发现它们的“狐狸尾巴”:

1.图像抓身体、空间结构逻辑,光影反射和材质细节。

2.视频抓一致性和动态逻辑。

3.音乐抓人声音质、编曲协调性和动态变化。

4.文本抓细节逻辑、带有数据的具体案例(科研、商业文)和表现情绪的手法。

好了,今天的分享就到这里了。若你也有一些辨别AI生成式内容的心得和方法,欢迎在评论区分享和讨论,也欢迎大家入群交流哦~

image.png


10
好文章,需要你的鼓励