个人怀疑数据是部分AI生成的,但是绝对有真实数据打底,因为在里面搜了下,我这边的村子、小区、街道全都有出现,这不是AI瞎写能写出来的
这里只讨论 person_info这个样本文件
此外
搜索1900可以得到:
AGE":121,"BIRTHDAY":"1900","BPLACE":"河北省**市**市","IDNO":"13098219000930**3*","IDTYPE":"01","QUERY_STRING":"河北省**市**市 121(年龄) 00 1900(出生日期) ","RNAME":"张润萌","SEX":"男"},"
在其中搜索马嘉祺可以得到:
AGE":121,"BIRTHDAY":"1900","BPLACE":"河北省**市**市","IDNO":"13098219000425**16","IDTYPE":"01","QUERY_STRING":"河北省**市**市 121(年龄) 00 1900(出生日期) ","RNAME":"马嘉祺","SEX":"男"},"_type":"a","sort":[6754350]}
上述两人所在的县市,1986年才设立。
18位身份证号码是从2009年10月1日开始实施的。
换句话说,在录入这两位信息的时候,至少已经109岁高龄了
政务上云,是2015年左右开始的
http://www.gov.cn/xinwen/2015-12/14/content_5023340.htm
除非上海GA把历年卷宗全部数字化录入了,否则个人认为这种情况还是很低的
(您可以搜索到多个AGE":121"或是120,1900年或是1901出生的人,但却不能搜索到任何一个1899年出生的人,见图)
如果这些百岁老人的数据是上海GA把历年卷宗数字化录入产生的,为什么1900年的这么多,而1899年的一个没有呢?
当然,这并不能实锤作假,我也不可能去村委会查询某个人是否存在... ...
个人见解:部分信息是真实的,不全的信息由AI生成补全,这些1900,1901等百余岁的出生的人,信息只有精确到县(市)的地址,如

无其他信息。而其他的则精确到小区甚至楼牌号
——
有人说会不会是录入不严谨导致的呢?有可能,如果系统里年龄出生日期都是按照身份证号码推算的,那么录入时不慎选成了最早的1900年,那么是有可能的。
但我校验了一些百岁老人的身份证(只根据校验码校验,未对接公安数据库),都是校验通过的
如果录入不谨慎,在不慎输错年龄的同时还能符合校验码的概率又有多少呢?
注:AGE":***"是相对于2021年的年龄,并非录入时的年龄,可以认为该数据导出日期最早为2021年
关于数据保存期限的问题,我看了另一个文件,是报警记录,是2002年-2019左右的,上海GA的确数字化了不少陈年信息
总结一下楼主的意思:
如何解释样本中含有大量1900年出生的人的数据?
不合理之处:
1. 上海公安部15年才开始录入数据,而数据被导出时间在2021年(见age键),这些大量的1900年出生的人的数据肯定不可能在15-21年之间被录入(因为他们肯定已去世了)。唯一的解释是系统有录入之前传统系统/纸质卷宗的数据,但数据量太大了,不太现实
2. 另外一种解释是,这些1900年出生的人根本不是1900年出生;因为各种问题,他们没有申报年龄/系统中没有他们的年龄,所以使用1900年作为默认出生年份。但问题在于,这些人又有合法的1900年出生的身份证号,这些身份证号是哪来的?
但这无法解释那些离奇的年龄对应的身份证号校验位校验通过这个事情,你说的当然是一种非常合理的情形,是 ...
有可能录入错误的是15位的,18位是批量自动转出来的。我说的这只是无数可能性之一,中国这么大,人这么多,可以造成这个问题的方式多了去了。
推荐楼 suaxi 10小时前
750k数据里搜了下老家的县名,找到了小学强迫我帮他做作业那个人,我日!
推荐楼 Omicron 10小时前
下载不会被查水表?
以前有个假的模拟健康码软件,下了一个玩玩然后就去派出所坐了几个小时
推荐楼 cdseoo 10小时前
御坂 发表于 2022-7-3 11:59
你说的没错,但是隶属于中华人民共和国中央人民政府的上海公安,的数字化系统中,存有两位121岁老人的报 ...
有没有可能录入不严谨,或者说系统内部分资料被刻意修改过。毕竟数据量庞大。
推荐楼 我是坏虫 10小时前
推荐楼 kyc 10小时前
你找存在真人真事的信息去核对一下你这么单纯的搜索我觉得可信性
推荐楼 rin 10小时前
挺逗的 隐藏的修仙者
推荐楼 lsin 8小时前
随机找几个报案的,发条短信问问。最刑最有用的核实方法
推荐楼 御坂 10小时前
可能录入的时候就不严谨
你说的也有可能
推荐楼 ddq 10小时前
我刚开始也觉得是假的 ,后面我下载了75w的看了一下,感觉又是真的了!!越看越真
2楼 zxxx 10小时前
大佬拿到数据了?
4楼 infplus 10小时前
真假混着就很离谱了
5楼 Timi- 10小时前
挺真实的,1900年是存在过的真实年份,所以说就是真的泄露
8楼 长留仙 10小时前
也许真有啊。
9楼 xieshang 10小时前
10楼 心上人 10小时前
进来看看怎么假的
12楼 infplus 10小时前
按照以往的习惯,不会叫这个名字吧?张润萌、马嘉祺都是最近比较流行的名字
13楼 长留仙 10小时前
我刚开始也觉得是假的 ,后面我下载了75w的看了一下,感觉又是真的了!!越看越真 ...
下载不会被查水表?
14楼 5678 10小时前
可能录入的时候就不严谨
15楼 Omicron 10小时前
下载不会被查水表?
以前有个假的模拟健康码软件,下了一个玩玩然后就去派出所坐了几个小时
16楼 suaxi 10小时前
750k数据里搜了下老家的县名,找到了小学强迫我帮他做作业那个人,我日!
17楼 御坂 10小时前
挺真实的,1900年是存在过的真实年份,所以说就是真的泄露
你说的没错,但是隶属于中华人民共和国中央人民政府的上海公安,的数字化系统中,存有两位121岁老人的报警数据,个人认为真实性存疑
18楼 长留仙 10小时前
以前有个假的模拟健康码软件,下了一个玩玩然后就去派出所坐了几个小时 ...
所以这些就不要下载。看看热闹就行。
19楼 Wine 10小时前
搜了下我那边的
没一个认识
20楼 御坂 10小时前
可能录入的时候就不严谨
你说的也有可能
22楼 weiai 10小时前
御坂 发表于 2022-7-3 11:59
你说的没错,但是隶属于中华人民共和国中央人民政府的上海公安,的数字化系统中,存有两位121岁老人的报 ...
有没有想过 这个是多少年之前的数据
23楼 nosec 9小时前
你说的没错,但是隶属于中华人民共和国中央人民政府的上海公安,的数字化系统中,存有两位121岁老人的报 ...
报警记录有无规定存留几年
24楼 eka 9小时前
但是他并不是放出所有数据, 如果真实数据打底, 部分ai生成, 那他为什么不只放真实数据, 少放一点数据也不打紧不是吗? 一些可能有误的数据我更倾向于工作人员录入失误, 毕竟各种魔幻新闻刷到的也不少吧, 相比而言刚出生就给你安排个1900出生也不算什么了
25楼 御坂 9小时前
有没有想过 这个是多少年之前的数据
根据里面的AGE“121”可以推断,导出日期应为2021年,公安数据数字化等问题已在主贴更新,请查阅
26楼 御坂 9小时前
有没有可能录入不严谨,或者说系统内部分资料被刻意修改过。毕竟数据量庞大。 ...
录入不严谨也是有可能的,例如著名的1970年1月1日(时间戳0 ),但你看更新的主贴,如果录入不严谨,为什么1900年的有这么多且信息不全,而1899年的一人也没有呢?而又为什么年龄更小的人*七八十岁)信息就很详细呢?这是录入不严谨所不能解释的
27楼 御坂 9小时前
但是他并不是放出所有数据, 如果真实数据打底, 部分ai生成, 那他为什么不只放真实数据, 少放一点数据也不打 ...
但这些1900年的身份证(抽测)校验通过,录入错误同时校验通过,个人认为概率还是低的
28楼 fall 9小时前
其实我发现有一部分信息是被duplicate过的,即相同名字,出生年份1900年左右,的人的数据被循环打出
29楼 fall 9小时前
总结一下楼主的意思:
如何解释样本中含有大量1900年出生的人的数据?
不合理之处:
1. 上海公安部15年才开始录入数据,而数据被导出时间在2021年(见age键),这些大量的1900年出生的人的数据肯定不可能在15-21年之间被录入(因为他们肯定已去世了)。唯一的解释是系统有录入之前传统系统/纸质卷宗的数据,但数据量太大了,不太现实
2. 另外一种解释是,这些1900年出生的人根本不是1900年出生;因为各种问题,他们没有申报年龄/系统中没有他们的年龄,所以使用1900年作为默认出生年份。但问题在于,这些人又有合法的1900年出生的身份证号,这些身份证号是哪来的?
30楼 御坂 9小时前
其实我发现有一部分信息是被duplicate过的,即相同名字,出生年份1900年左右,的人的数据被循环打出
...
个人认为可以归咎给AI样本过少导致,或者就是单纯导出没去重
32楼 yizhi 9小时前
真假混就没意思了,但是感觉还是真的
33楼 infplus 9小时前
fall 发表于 2022-7-3 12:41
总结一下楼主的意思:如何解释样本中含有大量1900年出生的人的数据?
根据名字也可以推断出。有部分是真的,另一部分AI补齐。
34楼 御坂 9小时前
真假混就没意思了,但是感觉还是真的
感觉可能是部分缺少的数据被AI补齐了,但我也不敢拿着数据找人去问。
35楼 中央银行 9小时前
合理推断
36楼 御坂 9小时前
报警记录有无规定存留几年
最早看到了2002年的数据,没有再早的了,我只是拿了样本
37楼 nosec 8小时前
最早看到了2002年的数据,没有再早的了,我只是拿了样本
报警记录20年和档案一样,合理看起来真实度高
38楼 Fleer 8小时前
其实拿号码核验一下应该就知道真实性了..
39楼 zth 8小时前
其实最简单办法就是,采集一下出生年份,跟官方公布的各年份出生人口做比对,如果大致符合的话就OK,有明显出入的话就实锤假的了
40楼 jiao1396009596 8小时前
可能有真有假
42楼 lsin 8小时前
随机找几个报案的,发条短信问问。最刑最有用的核实方法
43楼 theoneman 8小时前
卷宗数字化很早前就在做了。难道他们就不知道倒入数据库吗?
44楼 injy 8小时前
1900.01.01是部分系统日历的第一天,所以不可能有早于这一天的人。
如果没有录入出生年月这个数值是0 也就是1900.01.01.000
至于生日和身份证号的关系,也有可能是录入人不知道,瞎填的。
为什么瞎填两个数值是一样的呢? 很有可能是在录入系统做了限制,必需一致,所有录入人员就这样编的一个号码。
45楼 法外狂徒张三 8小时前
可怕
46楼 adrce 8小时前
拿去过游戏实名,不能过就是假的
47楼 NEET姬 7小时前
像上面说的 拿来试一下游戏实名之类的 能过就肯定是真的
48楼 御坂 19分钟前
这种121岁的证件能去游戏里实名认证吗
有些游戏是有对接公安部数据的,有些单纯算校验码,校验码对了即可通过验证 现在不知道什么情况
49楼 wwbfred 11分钟前
你太不了解中国了。首先你根本不知道这些信息是在什么情况下怎样录入的,有可能都是多年前电子化的时候手动录入的东西,各种错误一大堆。这些数据有些根本不会修改,有人说没自己的数据直接新插入一个,错的那个根本没人管。我这只是举了一个很简单的例子,实际操作起来,可以出错的环节太多了,有些错误可能还是为了绕过某些限制故意错填的。
50楼 御坂 9分钟前
你太不了解中国了。首先你根本不知道这些信息是在什么情况下怎样录入的,有可能都是多年前电子化的时候手动 ...
但这无法解释那些离奇的年龄对应的身份证号校验位校验通过这个事情,你说的当然是一种非常合理的情形,是完全有可能的,但录入错误同时还能让校验位通过..
52楼 御坂 2分钟前
有可能录入错误的是15位的,18位是批量自动转出来的。我说的这只是无数可能性之一,中国这么大,人这么多 ...
你说的这个有可能,这也解释了为什么这些人在18位身份证推行的时候已经百岁高龄,却有“合法”18位身份证了。
而他们信息早年录入较少,电子化后数据自然也较少,因为人已经过世了。
在这种情况下而出现问题,也就不足为奇了
申明:本文内容由网友收集分享,仅供学习参考使用。如文中内容侵犯到您的利益,请在文章下方留言,本站会第一时间进行处理。
谷姐靓号网








评论前必须登录!
立即登录 注册