程序员@IT·互联网互联网科技

《纽约时报》使用谷歌 AI 数字化 500 万张照片,寻找「不为

2018-11-21  本文已影响27人  极小光

简评:这可以说是技术和人文结合的最佳实践之一了,利用数字化的技术,从过去的照片中挖掘背后的故事。

100 多年来,下面这个位于时代广场办公室附近的数百个文件柜中,存放了超过 500 万张照片,这里被称为「morgue」。虽然卡片目录提供了存档内容的概述,但是照片中的许多内容都没有进入索引,而是尘封在这里。

被称为「morgue」的文件柜

《纽约时报》与 Google Cloud 合作,在其档案中对 500 万至 700 万张旧照片进行数字化处理。Google 的人工智能将负责在大量的历史图像中发掘背后「不为人知的故事」。

这个系统除了将照片以高分辨率存储在云中之外,还将识别文本、手写以及使用物理打印件找到的其他数据。

它同时能够提供一个强大的搜索引擎,用于搜索一个世纪的图像。

这里的照片可以追溯到 19 世纪后期,可以说是近一个多世纪影响我们现代世界的无价编年史。而 Google 的技术让这些历史再次活生生地回到我们眼前,比如这张宾夕法尼亚车站的旧照片,就是 Google AI 通过识别照片中的特征点,确定是宾夕法尼亚车站。

通过 Google Vision 识别后,能够在正反两面提取出文本:

NOV 27 1985
JUL 28 1992
Clock hanging above an entrance to the main concourse of Pennsylvania Station in 1942, and, right, exterior of the station before it was demolished in 1963.
PUBLISHED IN NYC
RESORT APR 30 ‘72
The New York Time THE WAY IT WAS – Crowded Penn Station in 1942, an era “when only the brave flew – to Washington, Miami and assorted way stations.”
Penn Station’s Good Old Days | A Buff’s Journey into Nostalgia
( OCT 3194
RAPR 20072
PHOTOGRAPH BY The New York Times Crowds, top, streaming into the old Pennsylvania Station in New Yorker collegamalan for City in 1942. The former glowegoyercaptouwd a powstation at what is now the General Postadigesikha designay the firm of Hellmuth, Obata & Kassalariare accepted and financed.
Pub NYT Sun 5/2/93 Metro
THURSDAY EARLY RUN o cos x ET RESORT
EB 11 1988
RECEIVED DEC 25 1942 + ART DEPT. FILES
The New York Times Business at rail terminals is reflected in the hotels
OUTWARD BOUND FOR THE CHRISTMAS HOLIDAYS The scene in Pennsylvania Station yesterday afternoor afternoothe New York Times (Greenhaus)

人们希望人工智能系统能够通过将以前难以识别的信息进行标记和分组,以此来挖掘新的故事和观点。而这些故事将成为全球人类宝贵的历史财富。


原文链接:NY Times Using Google AI to Digitize 5M+ Photos and Find 'Untold Stories'
推荐阅读:我们在大学图书馆发现了三本有毒的书

上一篇下一篇

猜你喜欢

热点阅读