マルチモーダルOCR特徴を用いたdynamic pointer networkによるテキスト付き画像説明文生成

植田, 有咲

Home »» Listing item »» Detail

Detail

Item Type

Article

ID

KO11003001-20230304-0023 　

Preview

Image
Caption

Full text

KO11003001-20230304-0023.pdf

Type	:application/pdf	Download
Size	:583.6 KB
Last updated	:Feb 20, 2024
Downloads	: 302

Total downloads since Feb 20, 2024 : 302
　

Release Date

Title

Title	マルチモーダルOCR特徴を用いたdynamic pointer networkによるテキスト付き画像説明文生成
Kana	マルチモーダル OCR トクチョウオモチイタ dynamic pointer network ニヨルテキストツキガゾウセツメイブンセイセイ
Romanization	Maruchimōdaru OCR tokuchō o mochiita dynamic pointer network ni yoru tekisutotsuki gazō setsumeibun seisei

Other Title

Title
Kana
Romanization

Creator

Name	植田, 有咲
Kana
Romanization
Affiliation	慶應義塾大学大学院理工学研究科開放環境科学専攻
Affiliation (Translated)
Role
Link

Edition

Place

横浜　

Publisher

Name	慶應義塾大学AI・高度プログラミングコンソーシアム
Kana	ケイオウギジュクダイガク AI・コウドプログラミングコンソーシアム
Romanization	Keiō gijuku daigaku AI kōdo puroguramingu konsōshiamu

Date

Issued (from:yyyy)	2023
Issued (to:yyyy)
Created (yyyy-mm-dd)
Updated (yyyy-mm-dd)
Captured (yyyy-mm-dd)

Physical description

Source Title

Name	AICカンファレンス予稿集
Name (Translated)
Volume
Issue
Year	2023
Month
Start page	23
End page	24

ISSN

ISBN

DOI

URI

JaLCDOI

NII Article ID

Ichushi ID

Other ID

Doctoral dissertation

Dissertation Number
Date of granted
Degree name
Degree grantor

Abstract

本研究では,テキスト情報を含む画像に対して説明文を生成するタスクに対して, マルチモーダルOCR特徴を含む複数のモダリティを利用した画像説明文生成モデルを提案する. 提案手法では画像中のテキスト領域を複数のモダリティに分割するマルチモーダルOCR特徴を導入する.さらに, 画像, 物体領域, マルチモーダルOCR特徴を含む複数モダリティ間の関係をモデル化するための相互注意を導入する. 提案手法はTextCapsデータセットにおいて既存手法を上回る結果を得た.

Table of contents

Keyword

Image Captioning 　

Multimodal Language Processing 　

Text-based Image Manipulation 　

NDC

Note

会議名 : AICカンファレンス2023
開催地 : 慶應義塾大学日吉キャンパス
日時 : 2023年3月4日
第2章ポスター発表要旨
ポスター要旨-1

Language

日本語　

Type of resource

text 　

Genre

Conference Paper 　

Text version

publisher 　

Related DOI

Access conditions

Last modified date

Feb 20, 2024 14:25:34 　

Creation date

Feb 20, 2024 14:25:34 　

Registerd by

mediacenter

History

Feb 20, 2024

インデックスを変更

Index

/ Public / Global Research Institute / AICカンファレンス予稿集 / 2023

Related to

慶應義塾大学学術情報リポジトリ（KOARA）

Language Select

Search

Indextree

Detail

Ranking

LINK