决策主力股票论坛|今日股市行情大盘分析查询

 找回密码
 立即/注册

扫一扫,访问微社区

QQ登录

只需一步,快速开始

搜索
上证指数 2634.05 +31.90 +1.23% 香港恒生 26457.580 +270.869 +1.03% 日经225 21807.00 +204.25 +0.95% 韩国综合 2099.02 +16.45 +0.79%
道琼斯 24527.27 +157.03 +0.64% 纳斯达克 7098.31 +66.48 +0.95% 英国富时 6886.05 +79.11 +1.16% 德国DAX 10950.46 +169.95 +1.58%
人民币 6.8664 -0.0136 -0.20% 原油 51.28 +0.2541% NYMEX原油 黄金 1251.4 +0.1120% COMEX黄金全球股市行情 2018年12月13日15时07分
查看: 5024|回复: 0

最新国际文本检测权威榜单发布:中国包揽前五

[复制链接]
发表于 2018-11-22 09:30:05 | 显示全部楼层 |阅读模式

光学字符识别(Optical Character Recognition,以下简称OCR)是指分析图像从而获取文字信息的过程,不少智能手机中的名片扫描软件就有这一功能。2018年11月20日,OCR领域的重要指标国际文档分析与识别大会(ICDAR)测试集被再次刷新,中国高校及企业包揽ICDAR2015排行榜前五,依次为云从科技(Pixel-Anchor)、南京大学与南京理工大学(PSENet)、旷视科技(Mask Text)、商汤科技(FOTS)、阿里巴巴(IncepText)。
国际文档分析与识别国际会议 (International Conference on Document Analysis and Recognition,ICDAR)是由国际模式识别学会(IAPR)组织的专业会议之一,专注于文本领域的识别与应用。为了提高自然场景的文本检测和识别水平,国际文档分析和识别会议(ICDAR)于2003年设立了鲁棒文本阅读竞赛(Robust Reading Competitions)。至今已有来自89个国家的3500多支队伍参与。Google、Microsoft、Amazon、Facebook、北京大学、中国科学技术大学、腾讯、搜狗等均曾参与其中。
鲁棒文本阅读竞赛的测试数据集一直在网上公开,可以随时提交结果,是自然场景文本检测行业中检验算法的测试数据集。ICDAR2015和ICDAR2017 MLT就是其中两个测试子集。
澎湃新闻采访了目前位于ICDAR2015榜单第一名的云从科技。云从科技研究院自身算法工程师李源介绍,CDAR2015和ICDAR2017 MLT是自然场景文本检测领域的权威数据集,基本上所有文章都会在上面检测。

▲CDAR2015榜单(2018年11月20日)。F值代表精度和检出率的调和平均数,也是排名的根据,F值越大,检测结果越优。
他为记者解读了这份榜单,精度(Precision)代表检测结果中正确文本的比例;检出率(recall)则反映被检出文本与图片文本总数的比例,能够体现是否漏检了文本。为了检测算法的效果,需要综合考虑精度和检出率,而F值正好代表精度和检出率的调和平均数,也是排名的根据。
需要注意的是,这里提到的自然场景文本检测并不等同于文本识别,前者不具备识别文字的功能,而是指在图片中检测出文本。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即/注册

本版积分规则



手机版|今日股市行情|联系我们|决策主力股票论坛 ( 鄂ICP备15023833号-1)点击这里给我发消息 鄂公网安备 42062502000040号

GMT+8, 2018-12-14 11:46

Powered by 今日股市

© 2001-2017 http://jue-ce.com/

快速回复 返回顶部 返回列表