写个字就能识别国籍,人工智能有多神?

2018-07-13 09:34:00 来源:脑极体
标签:

 

笔者高中时期,班里有一条完整的“假条产业链”。有人负责在外面打印店打印假条,有人负责模仿政教处主任签字,有人负责模仿班主任签字,还有人负责画政教处的印章。几个人功夫了得,每张假条5毛钱,出门成功率几乎高达百分之百。
 
当然,有人造假就有人打假。不知是谁走漏了风声(很可能是班主任安排的内奸),在某一个时间节点门卫突然开始严查假请假条,重点识别我们班的“工业流水产品”,导致出门成功率直线下降。假条没了市场,几个人又怕被查到,于是金盆洗手,火热的假条交易从此就落下了帷幕。此后沉渣虽又泛起了几次,但再也成不了气候了。
 
 
这充分说明,造假,尤其是笔迹造假这事儿其实挺简单的,但要不认真看的话也很难辨别真伪。学生尚且能如此,遑论那些专业的笔迹造假人员,签字、印章造假之事更是层出不穷。自然,在识别笔迹这件事儿上,人们也是下足了功夫。
 
分辨真假:传统笔迹识别的力之所及
笔迹识别其实是一件难度很高的事情。当然,这里讨论的主要是涉及到重要利益问题时候的笔迹造假。这种情况下,肯定不会找一些画虎类猫的人随随便便就把别人名字给写上去了,要找也得是有过专门的模仿经验的专业人员。
 
那么,在这种情况下,想要用肉眼就辨别真伪,就真的有点儿勉为其难了。因此,除了神奇的古人,要想让识别字迹这事儿变得靠谱,只能是借助计算机了。
 
 
笔迹识别的难点在于,其可供分析的样本较少,因此难以建立有效的字迹对比模型。比如,对识别真假签名,上哪儿去找那么多名字呢?人家也不可能处处留名。
 
因此,对笔迹的识别流程往往比较复杂,目前来说主要包括分别检验两种笔迹的运笔自然程度、大小、字形结构,确定两种笔迹的特征,然后进行比较各种特征的异同,最终做出综合判断。在人力时代,进行比较的时候以目力观察为主,常常需要借助摄影仪、显微镜、幻灯片等进行对比研究。
 
清华大学和公安部曾经推出一款能自动鉴别笔迹的“计算机笔迹识别系统”,其能将整个检验、对比和判断的过程自动化,对笔迹识别精准度的提升有很大的作用。
 
另外一个涉及到辨别真伪的方式则是对笔迹的时间进行推断。我们在电视上经常会看到有人拿着借条声称某人借钱不还,但实际上签名却是新的。这里就用到了书写时间鉴定的技术。
 
目前来说,可以做到通过对墨水成分的鉴定来看是否为同一支笔;通过墨迹的对墨水的溶解率的检测判断书写时间;并且在有公章的情况下,可以检测公章和签字的覆盖关系。
 
 
但是受限于文件的存放时间、存放条件、墨水的材料等诸多因素,鉴定的结果也会受到影响。以目前的技术而言,受这些因素的影响,其时间精确的误差可从几天大到几个月之间。
 
可以看出的是,传统的笔迹识别主要是停留在辨别真伪的层面。由于技术条件的限制,其精准度有待提高,作为证据采用的可信度自然尚需斟酌。但相比手工时代轻易的鱼目混珠,利用计算机来进行笔迹识别和判断墨迹时间已经是一个非常大大的进步了。
 
当然,永不满足的人类还想要更大的进步。
 
从看人格到定国籍:AI时代的笔迹识别新大陆
对解决传统的笔迹识别问题,AI或许可以帮上一点忙。虽然AI也需要充分的样本学习才能建立较为准确对比模型,但在同样的数据条件下,AI的深度学习能力能帮助其作出相对更精准的判断。
 
而AI的重要意义不仅仅在于缓解传统笔迹识别的问题,更在于其为笔迹识别开发出了新的可能。
 
1. 人格预测。Sinhgad Institute of Technology的研究人员们通过对单词的页边距(在固定网格中的位置)、单词间距、行距等几个方面进行切割分析过笔压、大小、边距、字体区域、倾斜程度、基线等进行特征提取,然后将其分类,并分析其不同类别与人格、情感的关系。在经过学习之后,系统可以在最短的时间内进行情绪的识别和人格的预测,从而提高人格预测的准确性。
 
  
 
2. 国籍识别。一个由中国、马来西亚和印度研究人员组成的研究小组则将字体作为与虹膜、面部等有相通作用的生物特征的一种,以此来判断其国籍、性别等,从而来查明涉及不同国家国民的罪行。
 
在方法上,其通过对中国、印度、马拉西亚、伊朗和孟加拉国等五个亚洲国家的100位作家的书写英文的字迹进行分析,利用一种名为cold的线性分布识别工具,从线条、倾斜方向、整体形状等方面来对AI系统进行训练学习。比如中国人汉字横平竖直,因此写英文的时候呈现出线条偏硬的特征;而印度和孟加拉国写字则偏圆润。除此之外,100位作家中还有10位女性,因此其还顺便测试了一把男女的差别。
 
  
 
如果说仅仅辨别真假还是初阶的话,那用AI通过识别字体能够判断人的性格乃至国籍就有点一步跃升到高阶的味道了。而从另一个角度来说,这也有一定的科学依据。毕竟,在之前曾有人研发出AI的步态识别技术,通过一个人的姿势来判断人,说明这种生物行为在每个人身上都是不一样的。那么,写字作为动作的一种,人的性格、生理等诸多因素也很可能会对它产生影响。
 
而中国人也常说,“字如其人”,这句话在今天看来,算是找到了科学依据。
 
但无论是人格判断还是国籍识别,其都尚且只是停留在论文或实验室层面,要想走入现实,恐怕仍然有很长的一段路。
 
关注与非网微信 ( ee-focus )
限量版产业观察、行业动态、技术大餐每日推荐
享受快时代的精品慢阅读
 

 

继续阅读
真同传,假AI,科大讯飞AI同传被指造假
真同传,假AI,科大讯飞AI同传被指造假

哪有什么AI同传,明明是剽窃我这个人类同传译员!

通过2018年中国半导体销量及市场分析,目前处于哪个发展阶段?
通过2018年中国半导体销量及市场分析,目前处于哪个发展阶段?

半导体,指常温下导电性能介于导体与绝缘体之间的材料。半导体在收音机、电视机以及测温上有着广泛的应用。如二极管就是采用半导体制作的器件。半导体是指一种导电性可受控制,范围可从绝缘体至导体之间的材料。

聚力AI,艾拉比荣获“优秀服务机器人企业奖”

2018世界人工智能大会期间,RFC中关村双创服务机器人联盟承办以“聚力AI,内容赋能”为主题的2018首届机器人创始人影响力峰会。

更多资讯
史上最详细的电阻科普文章,小小电阻藏着大奥秘

电阻,和电感、电容一起,是电子学三大基本无源器件;从能量的角度,电阻是一个耗能元件,将电能转化为热能。

MLCC产业现状和未来走势分析

自2016年年中以来,曾经不起眼的多层陶瓷电容器MLCC搅动了整个被动电子元件市场,其行情更是步步高涨,一次又一次刷新了人们对MLCC价格走势的认知度。该不正常的态势引发了行业对MLCC全产业链的极大关注,纷纷揣测其未来走势如何。

为何大批人才都希望进入达摩院?
为何大批人才都希望进入达摩院?

阿里巴巴在这一天公布达摩院的最新架构。4+X实验室,如同四轮驱动的跑车,再加上一处神秘的动力引擎,共同承载着这个中国企业中人才含金量最高的科研机构飞奔。

2018上海工博会今日开幕,威盛带来前沿AI+嵌入式技术

2018中国工博会今日在上海国家会展中心隆重开幕,以“创新、智能、绿色”为主题,吸引了国内外2000多家厂商参展,有近300项最新技术与产品会在现场首发。

中国600亿美元贸易反制,含被动元件和存储器(附清单)

作为对美国即将于9月24日对2000亿美元自中国进口产品加征关税的有力反击,9月18日国务院关税税则委员会发布公告,决定对原产于美国的5207个税目进口商品,自2018年9月24日12时01分起加征关税,该措施涉及自美进口贸易额约600亿美元。

Moore8直播课堂
电路方案