Detailed conference program

Timetable

Jump to Day 2 (July 27), Day 3 (July 28)

July 26 (Saturday)

Registration (8:30–)

Opening (9:00–9:30)

IAPR Invited Talk 1 (9:30–10:30)

Chair: Chun-Yi Lee

Building World Foundation Models for Unlocking Physical AI
Ming-Yu Liu (NVIDIA)

Oral 1-1: 3D Vision and Scene Understanding (10:45–11:45)

Chair: Ichiro Ide

O1-1-1 Leveraging 2D-VLM for Label-Free 3D Segmentation in Large-Scale Outdoor Scene Understanding
Toshihiko Nishimura (NTT Corporation); Hirofumi Abe (NTT Corporation); Kazuhiko Murasaki (NTT Corporation); Taiga Yoshida (NTT Corporation); Ryuichi Tanida (NTT Corporation)
O1-1-2 FMDP: Leveraging a Foundation-Model for Dual-Pixel Disparity Estimation
Doehyung Lee (Institute of Science Tokyo); Zhuofeng Wu (Institute of Science Tokyo); Yusuke Monno (Institute of Science Tokyo); Masatoshi Okutomi (Institute of Science Tokyo)
O1-1-3 Capturing Fine-Grained Alignments Improves 3D Affordance Detection
Junsei Tokumitsu (Keio AI Research Center); Yuiga Wada (Keio AI Research Center)

Poster 1 snapshot (13:00–13:30)

Chair: TBD

Poster 1 (13:30–15:00)

Posters from Oral Sessions 1-1, 1-2, 1-3, and 3-1 are also included in this session.

P1-01 Noise-based Regularized Training for Diffusion Models
Yuzhang Shang (Illinois Institute of Technology); Yubin Lu (Illinois Institute of Technology); Jinchao Feng (Johns Hopkins University); Ming Zhong (Illinois Institute of Technology); Yan Yan (University of Illinois at Chicago)
P1-02 Bidirectional Action Sequence Learning for Long-term Action Anticipation with Large Language Models
Yuji Sato (Panasonic Connect Co.,Ltd.); Yasunori Ishii (Panasonic Holdings); Takayoshi Yamashita (Chubu University)
P1-03 RGB-Thermal Cooperative Robot Vision Strategy for Multi-Person Tracking in Both Well-Lit and Low-Light Scenes
Tatsuro Sakai (University of Fukui); Kanji Tanaka (University of Fukui); Jonathan Tay Yu Liang (University of Fukui); Muhammad Adil Luqman (University of Fukui); Daiki Iwata (University of Fukui)
P1-04 A Minimalist Approach to HDR Image Compression with Applications to Low-Light Image Enhancement
Alexander Belyaev (Heriot-Watt University); Pierre-Alain Fayolle (University of Aizu); Shin Yoshizawa (RIKEN); Hideo Yokota (RIKEN)
P1-05 Magic for the Age of Quantized DNNs
Ryuji Saiin (AISIN Co., Ltd.); Kazuma Suetate (AISIN SOFTWARE Co., Ltd); Yoshihide Sawada (Independent researcher)
P1-06 A Lightweight Convolutional Neural Network for Underwater Image Quality Enhancement
Ming-Wei Chen (National Chung Hsing Univ.); Chia-Yeh Lin (National Chung Hsing Univ.); Shun-Pin Hsu (National Chung Hsing Univ.)
P1-07 Real-Time Fire Detection Using Hybrid Feature Extraction: Color, Texture, and Motion Analysis
Waffiq Maaroja (Universitas Gadjah Mada); Aufaclav Zatu Kusuma Frisky (Universitas Gadjah Mada); Fadillah Siva (Universitas Gadjah Mada); Hanum Khairana Fatmah (Universitas Gadjah Mada)
P1-08 Viewpoint-Aware 3D Dense Captioning
Yuta Irisawa (Aoyama Gakuin University); Seiya Ito (National Institute of Information and Communications Technology); Tomoaki Yamazaki (Aoyama Gakuin University); Ken Sakurada (Kyoto University); Ryuhei Hamaguchi (National Institute of Advanced Industrial Science and Technology); Masaki Onishi (National Institute of Advanced Industrial Science and Technology); Kouzou Ohara (Aoyama Gakuin University)
P1-09 Transformer-based Visual Grounidng with Inter-Modality Cross-Attention
Yu-Hong Zheng (Nation Chin-Yi University of Technology); Guo-SHiang Lin (National Chin-Yi University of Technology); Ku-Yaw Chang (National Chin-Yi University of Technology)
P1-10 Unsupervised 3D Braided Hair Reconstruction from a Single-View Image
Jing Gao (Carnegie Mellon University)
P1-11 Enhancing Reliability of Medical Image Diagnosis through Top-rank Learning with Rejection Module
XIAOTONG JI (Kyushu University); Ryoma Bise (Kyushu University); Seiichi Uchida (Kyushu University)
P1-12 Pre-Manipulation Alignment Prediction for Open-Vocabulary Object Manipulation Based on End-Effector Trajectories
Motonari Kambara (Keio University); Komei Sugiura (Keio University)
P1-13 Domain Generalization of Pathological Image Segmentation by Patch-Level and WSI-Level Contrastive Learning
Yuki Shigeyasu (Kyushu University); Shota Harada (Kyushu University); Akihiko Yoshizawa (Nara Medical University); Kazuhiro Terada (Kyoto University Hospital); Naoki Nakazima (Kyoto University Hospital); Mariyo Kurata (Kyoto University Hospital); Hiroaki Ito (Kyoto University Hospital); Hiroyuki Abe (The University of Tokyo Hospital); Tetsuo Ushiku (The University of Tokyo Hospital); Ryoma Bise (Kyushu University)
P1-14 Dynamic Age Estimation via Mixture of Experts: Bridging Semantic and Structural Models
Yu-Ling Chen (National Taiwan University of Science and Technology); Yu-Hsuan Chiu (National Taiwan University of Science and Technology); Ching-Hsun Chang (National Taiwan University of Science and Technology); Gee-Sern Hsu (National Taiwan University of Science and Technology)
P1-15 Temporal Conditioning for Realistic Performance Video Generation from Instrumental Sounds
Yusaku Nakanose (Osaka Metropolitan University); Chito Nakagawa (Osaka Metropolitan University); Katsufumi Inoue (Osaka Metropolitan University); Michifumi Yoshioka (Osaka Metropolitan University)
P1-16 Binned MSE for Imbalanced Dust Density Estimation
Andreas Michel (Fraunhofer IOSB); Wolfgang Gross (Fraunhofer IOSB); Jannik Sheikh (Fraunhofer IOSB); Jannick Kuester (Fraunhofer IOSB); Martin Weinmann (Karlsruhe Institute of Technology)
P1-17 IG-ODAM: Instance-Aware Visual Explanations for Object Detection with Integrated Gradients
Yuma Nakai (Chubu University); Tsubasa Hirakawa (Chubu University); Takayoshi Yamashita (Chubu University); Hironobu Fujiyoshi (Chubu University)
P1-18 ShadowAug: A Multi-Strategy Data Augmentation Method for Image Shadow Removal
Yujie Wang (Waseda University); Fengshan Zhao (Nanjing University); Wuyou Zhou (Waseda University); Zheyi Li (Waseda University); Ziyang Li (Nanjing University); Qin Liu (Nanjing University); Takeshi Ikenaga (Waseda University)
P1-19 Any-scale Object Detection using Arbitrary-scaled Images
Kazutoshi Akita (TTI-J); Norimichi Ukita (TTI-J)
P1-20 3D Object Reconstruction Through Integration of Hyperspectral and RGB-D Imaging
Cheng Hong (University of Tsukuba); Fumio Kanehiro (University of Tsukuba; CNRS-AIST JRL, AIST); Guillaume Caron (University of Picardie Jules Verne; CNRS-AIST JRL, AIST); Nevrez Imamoglu (CNRS-AIST JRL, AIST; Digital Architecture Research Center, AIST)
P1-21 Parallel Sampling of Diffusion Models on SO(3)
YanTing Chen (National Taiwan University); Hao-Wei Chen (National Taiwan University); Tsu-Ching Hsiao (National Taiwan University); Chun-Yi Lee (National Taiwan University)
P1-22 Style-Preserving Diffusion for Scene Text Editing
Wei-Zhe Jian (National Taiwan University of Science and Technology); Gee-Sern Hsu (National Taiwan University of Science and Technology)
P1-23 FlowLoss: Dynamic Flow-Conditioned Loss Strategy for Video Diffusion Models
Kuanting Wu (Institute of Science Tokyo); Kei Ota (Mitsubishi Electric); Asako Kanezaki (Institute of Science Tokyo)

Oral 1-2: Medical Imaging and Microscopy (15:00–16:00)

Chair: Kyoko Sudo

O1-2-1 Self-supervised 3D Image Deburring for Lattice Light Sheet Microscopy
Ziyi Chen (Osaka University); Shiro Suetsugu (Nara Institute of Science and Technology); Yuko Kiyosue (Kansai Medical University); Hajime Nagahara (Osaka University)
O1-2-2 ZECO: ZeroFusion Guided 3D MRI Conditional Generation
Feiran Wang (Illinois Institute of Technology); Bin Duan (University of Michigan); Jiachen Tao (University of Illinois, Chicago); Nikhil Sharma (Illinois Institute of Technology); Dawen Cai (University of Michigan); Yan Yan (University of Illinois, Chicago)
O1-2-3 Advancing Disease Detection Using Deep Learning in Low-Data Environments
Jian-Ming Lu (National Taiwan University); Chien-Fu Chen (National Taiwan University)

Oral 1-3: Image Synthesis and Generation (16:15–17:15)

Chair: Ryota Yoshihashi

O1-3-1 DLSF: Dual-Layer Synergistic Fusion for High-Fidelity Image Synthesis
Zhen-Qi Chen (National Yang Ming Chiao Tung University); Yuan-Fu Yang (National Yang Ming Chiao Tung University)
O1-3-2 Data-driven Head Motion Generation through Natural Gaze-Head Coordination
Xiaohan Liu (The University of Tokyo); Yilin Wen (Institute of Industrial Science, The University of Tokyo); Yusuke Sugano (Institute of Industrial Science, The University of Tokyo)
O1-3-3 Low-Latency Real-Time Audio-Driven Talking Head Generation Based on Future Speech Feature Prediction
Weijie Guo (Aoyama Gakuin University), Naoshi Kaneko (Tokyo Denki University), Yoshiaki Akazawa (KYOCERA Corporation)

July 27 (Sunday)

Registration (8:30–)

IAPR Invited Talk 2 (9:00–10:00)

Chair: Hideo Saito

Learning World Simulators from Data
Katerina Fragkiadaki (CMU)

Technical event (10:15–11:00)

Chair: Norimichi Ukita

TE-1 MVA 2025 Small Multi-Object Tracking for Spotting Birds Challenge: Dataset, Methods, and Results
Yuki Kondo (Toyota Motor Corporation); Norimichi Ukita (Toyota Technological Institute); Riku Kanayama (Toyota Technological Institute); Yuki Yoshida (Toyota Technological Institute); Takayuki Yamaguchi (Iwate Prefecture Coastal Regional Development Bureau); Xiang Yu (Nanjing University); Guang Liang (Nanjing University); Xinyao Liu (University of Science and Technology of China); Guan-Zhang Wang (National Cheng Kung University); Wei-Ta Chu (National Cheng Kung University); Bing-Cheng Chuang (National Tsing Hua University); Jia-Hua Lee (National Tsing Hua University); Pin-Tseng Kuo (National Tsing Hua University); I-Hsuan Chu (National Tsing Hua University); Yi-Shein Hsiao (National Tsing Hua University); Cheng-Han Wu (National Tsing Hua University); Po-Yi Wu (National Taiwan University); Jui-Chien Tsou (National Taiwan University); Hsuan-Chi Liu (National Taiwan University); Chun-Yi Lee (National Taiwan University); Yuan-Fu Yang (National Yang Ming Chiao Tung University); Kosuke Shigematsu (National Institute of Technology, Oita College); Asuka Shin (National Institute of Technology, Oita College); Ba Tran (Axelspace Corporation)
TE-2 Intersection-based Ensemble for Small Multi-Object Tracking in Challenging Environments
Guan-Zhang Wang (National Cheng Kung University); Wei-Ta Chu (National Cheng Kung University)
TE-3 Boosting Small Object Tracking via Collaborative Detection Transformer
Bing-Cheng Chuang (National Tsing Hua University); Jia-Hua Lee (National Tsing Hua University); Pin-Tseng Kuo (National Tsing Hua University); I-Hsuan Chu (National Tsing Hua University); Yi-Shein Hsiao (National Tsing Hua University); Cheng-Han Wu (National Tsing Hua University); Po-Yi Wu (National Taiwan University); Jui-Chien Tsou (National Taiwan University); Hsuan-Chi Liu (National Taiwan University); Chun-Yi Lee (National Taiwan University); Yuan-Fu Yang (National Yang Ming Chiao Tung University)
TE-4 Confidence-based Adaptive Weighted Boxes Fusion for Multi-Object Tracking of Small Birds
Kosuke Shigematsu (National Institute of Technology, Oita College);Asuka Shin (National Institute of Technology, Oita College)
TE-5 Joint Q&A session for all presenters
TE-6 Award announcement and closing remarks

Oral 2-1: Domain Adaptation and Segmentation (11:30–12:30)(11:15–12:15)

Chair: Ryo Yonetani

O2-1-1 Leveraging Masked Feature and Consistency Regularization for Unsupervised Domain Adaptation Based Semi-Supervised Semantic Segmentation
Chi-Teng Yeh (National Chung Cheng University); Hao-Ting Li (National Chung Cheng University); Kuo-En Chen (National Chung Cheng University); Chen-Kuo Chiang (National Chung Cheng University)
O2-1-2 MoExDA: Domain Adaptation for Edge-based Action Recognition
Takuya Sugimoto (Nagoya Institute of Technology); Ning Ding (Nagoya Institute of Technology); Toru Tamaki (Nagoya Institute of Technology)
O2-1-3 MobileSACNet: Lightweight Spectral-Spatial Compression for Hyperspectral Segmentation in Autonomous Driving Systems
Chao Wang (Hiroshima City University); Daisuke Miyazaki (Hiroshima City University)

Poster 2 snapshot (13:40–14:10)(13:30–14:00)

Poster 2 (14:10–15:40)(14:00–15:30)

Posters from Oral Sessions 2-1, 2-2, and 2-3 are also included in this session.

TE-1 MVA 2025 Small Multi-Object Tracking for Spotting Birds Challenge: Dataset, Methods, and Results
TE-3 Boosting Small Object Tracking via Collaborative Detection Transformer
P2-01 Age Prediction of Komatsuna using Hu Moments with Neural Networks for Small Datasets
Moeri Okuda (University of Hyogo); Shinsaku Hiura (University of Hyogo)
P2-02 Revisiting Self-Generating Simple Figure Patterns for Learning Microscopy Image Segmentation
Shuhei Iijima (Kioxia Corporation); Takuji Ohashi (Kioxia Corporation); Yu-Chieh Lin (Kioxia Corporation); Youyang Ng (Kioxia Corporation)
P2-03 Semantic Segmentation of iPS Cells: Case Study on Model Complexity in Biomedical Imaging
ZHANG Maoquan (Hiroshima University); Bisser Raytchev (Hiroshima University); Sun Xiujuan (WeiFang University of Science and Technology)
P2-04 Snapshot Hyperspectral Imaging using Petrographic Thin Section
Yuta Fujimoto (Nara Institute of Science and Technology); Kazuya Kitano (Nara Institute of Science and Technology); Kazuma Fujiwara (Nara Institute of Science and Technology); Yuki Fujimura (Nara Institute of Science and Technology); Takuya Funatomi (Nara Institute of Science and Technology); Yasuhiro Mukaigawa (Nara Institute of Science and Technology)
P2-05 Cross-Modal Knowledge Distillation from First-Person Views to Third-Person BEV Maps for Universal Point Goal Navigation
Riku Uemura (University of Fukui); Kanji Tanaka (University of Fukui); Daiki Iwata (University of Fukui); Kenta Tsukahara (University of Fukui); Daigo Nakajima (University of Fukui); Tomoe Hiroki (University of Fukui)
P2-06 Impact of Optical System Size on Robustness in Laser Speckle Authentication
Naoki Fujieda (Nara Institute of Science and Technology); Kazuya Kitano (Nara Institute of Science and Technology); Takuya Funatomi (Nara Institute of Science and Technology); Rui Ishiyama (NEC Corporation, Nara Institute of Science and Technology); Yasuhiro Mukaigawa (Nara Institute of Science and Technology)
P2-07 Guidelines for Optimizing Optical System Design for Laser Speckle Authentication
Kazuya Kitano (Nara Institute of Science and Technology); Johannes Binder (Nara Institute of Science and Technology); Rui Ishiyama (NEC Corporation, Nara Institute of Science and Technology); Tsukasa Matsuo (NEC Corporation); Takuya Funatomi (Nara Institute of Science and Technology); Yasuhiro Mukaigawa (Nara Institute of Science and Technology)
P2-08 Modifying Generative Distributions in Latent Diffusion Models to Improve Alignment with Desired Properties
Sven Sickert (Computer Vision Group, Friedrich Schiller University Jena); Maria Gogolev (Computer Vision Group, Friedrich Schiller University Jena); Niklas Penzel (Computer Vision Group, Friedrich Schiller University Jena); Tim Büchner (Computer Vision Group, Friedrich Schiller University Jena); Joachim Denzler (Computer Vision Group, Friedrich Schiller University Jena)
P2-09 Real-Time LiDAR Point Cloud Densification for Low-Latency Spatial Data Transmission
Kazuhiko Murasaki (NTT Corporation); Shunsuke Konagai (NTT Corporation); Masakatsu Aoki (NTT Corporation); Taiga Yoshida (NTT Corporation); Ryuichi Tanida (NTT Corporation)
P2-10 Statistic Temporal Checking and Depth Layering based Multi-Object Relative Size Estimation from Monocular Video
Ziyue Wang (Waseda University); Xina Cheng (Xidian University); Takeshi Ikenaga (Waseda University)
P2-11 Edge-Augmented HLAC and Gaussian Distribution-Based Weighted Feature Extraction for 1-ms Abnormal Detection System in Logistics
Yuanfeng Zhang (Graduate School of Information, Production and Systems, Waseda University); Wenshuo Wu (Graduate School of Information, Production and Systems, Waseda University); Tingting Hu (R&D Division, Panasonic Connect Co., Ltd.); Manabu Inoue (R&D Division, Panasonic Connect Co., Ltd.); Hiroshi Mitani (R&D Division, Panasonic Connect Co., Ltd.); Takeshi Ikenaga (Graduate School of Information, Production and Systems, Waseda University)
P2-12 Geometrically Constrained Position Estimation through Low-level Tracking
Henry Wood (The University Of Sheffield); Andrew Mills (The University Of Sheffield); Will Jacobs (The University Of Sheffield); Visakan Kadirkamanathan (The University Of Sheffield)
P2-13 Very Similar Appearance Feature Classification for Chronic Endometritis Diagnosis in Hysteroscopy Images
Yuki Yoshida (Toyota Technological Institute); Yuki Sawada (Nagoya City University); Takeshi Sato (Nagoya City University); Mayumi Sugiura-Ogasawara (Nagoya City University); Norimichi Ukita (Toyota Technological Institute)
P2-14 Detecting Hand-Object Interaction Based on Movements in Hand Surrounding Region
Rikuto Konishi (Tohoku University); Taichi Uchimura (Tohoku University); Toru Abe (Tohoku University)
P2-15 Multi-Person Pose Estimation Evaluation Using Optimal Transportation and Improved Pose Matching
Takato Moriki (Toyota Technological Institute); Hiromu Taketsugu (Toyota Technological Institute); Norimichi Ukita (Toyota Technological Institute)
P2-16 Object State Recognition in Cooking Videos through End State Frames Analysis
Yutaro Kitakami (Osaka Metropolitan University); Katsufumi Inoue (Osaka Metropolitan University); Michifumi Yoshioka (Osaka Metropolitan University)
P2-17 Detection of Medial Epicondyle Avulsion in Elbow Ultrasound Images via Bone Structure Reconstruction
Shizuka Akahori (University of Tsukuba); Shotaro Teruya (University of Tsukuba); Pragyan Shrestha (University of Tsukuba); Yuichi Yoshii (Tokyo Medical University); Satoshi Iizuka (University of Tsukuba); Akira Ikumi (University of Tsukuba); Hiromitsu Tsuge (Kikkoman General Hospital); Itaru Kitahara (University of Tsukuba)
P2-18 Point Cloud Edge Extraction Based on 3D Point Separability Filter with Spherical Mask
Gulpi Qorik Oktagalu Pratamasunu (University of Tsukuba); Naish Ibrahim (University of Tsukuba); Hiroaki Kawamoto (University of Tsukuba); Kazuhiro Fukui (University of Tsukuba)
P2-19 Gaze Attention Estimation for Medical Environments
Natchapol Shinno (Kyushu Institute of Technology); Yuki Furuya (Kyushu Institute of Technology); Takeshi Saitoh (Kyushu Institute of Technology); Haibo Zhang (Kyushu Institute of Technology); Keiko Tsuchiya (Yokohama City University ); Hitoshi Sato (Yokohama City University ); Frank Coffey (Nottingham Univ Hosp NHS Trust)
P2-20 Modality Selection and Skill Segmentation via Cross-Modality Attention
Jiawei Jiang (Institute of Science Tokyo); Kei Ota (Mitsubishi Electric); Devish Jha (MERL); Asako Kanezaki (Institute of Science Tokyo)
P2-21 Efficient Skeleton-Based Action Recognition using Superposed Shape Subspace
Santos Safrao (University of Tsukuba); Kazuhiro Fukui (University of Tsukuba)

Oral 2-2: Computer Vision for Real-World Applications (15:40–16:40)(15:30–16:30)

Chair: Kazuya Nishimura

O2-2-1 Supervised Domain Adaptation from Scene Text Recognition for Licence Plate Recognition
Novanto Yudistira (Brawijaya University)
O2-2-2 CLIP-Guided Cross-Modal Feature Fusion based Few-Shot Learning for Nighttime Pavement Defect Detection
Chongchong ZAN (Waseda University); Songlin DU (Southeast University); Takeshi Ikenaga (Waseda University)
O2-2-3 Decoupled Scale and Appearance for Optimal Deep Diamond ReID
Arno Waes (Kuleuven); Bram Claes (AntwerpLabs); Toon Goedemé (Kuleuven)

Oral 2-3: Image Enhancement and Restoration (16:55–17:35)(16:45–17:45)

Chair: Rei Kawakami

O2-3-1 IRR-RADA: A Reflection-Aware Saliency Map and Adaptive Curriculum Learning Based Data Augmentation Method for Image Reflection Removal
Wuyou Zhou (Waseda University); Fengshan Zhao (Nanjing University); Yujie Wang (Waseda University); Qin Liu (Nanjing University); Takeshi Ikenaga (Waseda University)
O2-3-2 Simple Yet Effective Way to Use Polarimetric Information in Stereo Matching
Jinyu Zhao (Institute of Science Tokyo); Yusuke Monno (Institute of Science Tokyo); Masatoshi Okutomi (Institute of Science Tokyo)

July 28 (Monday)

Registration (8:45–)

Oral 3-1: Scene Understanding and Human-Computer Interaction (9:15–10:15)

Chair: Yoshihiko Mochizuki

O3-1-1 Scene Recognition Meets Knowledge Graphs: Enhancing Robustness to Object Diversity
Keisuke Yamashita (Aoyama Gakuin University); Seiya Ito (National Institute of Information and Communications Technology); Tomoaki Yamazaki (Aoyama Gakuin University); Kouzou Ohara (Aoyama Gakuin University)
O3-1-2 An Automatic Rating Approach Using Machine Learning and Feature Selection for Finger Tapping in MDS-UPDRS Part III
Yi-Hung Chiu (I-Shou University); Tung-Kuan Liu (National Kaohsiung University of Science and Technology); Chih-Ping Yang (Chi Mei Medical Center); Ching-Fang Chien (Kaohsiung Medical University Hospital); Li-Min Liou (Kaohsiung Medical University); Lung-Chang Lin (Kaohsiung Medical University); Huei-Ping Dong (Fooyin University); Chen-Sen Ouyang (National Kaohsiung University of Science and Technology)
O3-1-3 Analysis and Prediction of Attractive Fonts on Title-overlaid Food Images
Nanami Takagi (Nagoya University); Haruya Kyutoku (Aichi University of Technology); Keisuke Doman (Chukyo University); Takahiro Komamizu (Nagoya University); Ichiro Ide (Nagoya University)

IAPR Invited Talk 3 (10:30–11:30)

Chair: Ryo Yonetani

Making sense of the real-world via 3D Computer Vision
Yasuyuki Matsushita (MSRA Tokyo)

Award ceremony (11:30–11:45)

Tutorial 1 (13:15–14:45)

Learning and Improving Multimodal Commonsense Reasoning
Bo Wu (MIT-IBM Watson AI Lab)

Tutorial 2 (15:00–16:30)

Developing and Evaluating Interactive Lifelog Retrieval Systems
Cathal Gurrin (Dublin City University)

MVA2025

Detailed conference program

July 26 (Saturday)

Registration (8:30–)

Opening (9:00–9:30)

IAPR Invited Talk 1 (9:30–10:30)

Oral 1-1: 3D Vision and Scene Understanding (10:45–11:45)

Poster 1 snapshot (13:00–13:30)

Poster 1 (13:30–15:00)

Oral 1-2: Medical Imaging and Microscopy (15:00–16:00)

Oral 1-3: Image Synthesis and Generation (16:15–17:15)

July 27 (Sunday)

Registration (8:30–)

IAPR Invited Talk 2 (9:00–10:00)

Technical event (10:15–11:00)

Oral 2-1: Domain Adaptation and Segmentation (11:30–12:30)(11:15–12:15)

Poster 2 snapshot (13:40–14:10)(13:30–14:00)

Poster 2 (14:10–15:40)(14:00–15:30)

Oral 2-2: Computer Vision for Real-World Applications (15:40–16:40)(15:30–16:30)

Oral 2-3: Image Enhancement and Restoration (16:55–17:35)(16:45–17:45)

July 28 (Monday)

Registration (8:45–)

Oral 3-1: Scene Understanding and Human-Computer Interaction (9:15–10:15)

IAPR Invited Talk 3 (10:30–11:30)

Award ceremony (11:30–11:45)

Tutorial 1 (13:15–14:45)

Tutorial 2 (15:00–16:30)

Banquet (18:00–)