SIBR (SIBR Dataset for VIE in the Wild)

Introduced by Yang et al. in Modeling Entities as Semantic Points for Visual Information Extraction in the Wild

SIBR是面向自然场景视觉信息抽取的数据集。

1)SIBR总的有1000张图片,400张测试,600张训练,包括中文、英文两种语言。 2)包含images.zip、label.zip、train.txt、test.txt四个文件,images.zip、label.zip中包含所有图片和标签,通过train.txt和test.txt区分训练和测试。 3)标注规则与FUNSD、XFUND一致,实体类别包括header、question、answer、other四类,但与之不同的是除了提供link id之外,还标注了link type。link type包括inter以及intra两种,inter表示实体间的link,也即是一对kv对之间的link;而intra表示同一个实体内部segment之间的link。通过intra将多行文字组成一个实体,通过inter将实体组成kv对。

Papers


Paper Code Results Date Stars

Dataset Loaders


Tasks


Similar Datasets


Modalities


Languages