研究者詳細

顔写真

ミヤザキ トモ
宮崎 智
Tomo Miyazaki
所属
大学院工学研究科 通信工学専攻 通信システム工学講座(画像情報通信工学分野)
職名
准教授
学位
  • 博士(工学)(東北大学)

  • 修士(工学)(東北大学)

経歴 4

  • 2024年5月 ~ 継続中
    東北大学 准教授

  • 2015年4月 ~ 2024年4月
    東北大学 助教

  • 2013年1月 ~ 2015年3月
    東北大学 産学官連携研究員 研究員

  • 2011年4月 ~ 2012年12月
    (株)日立製作所ディフェンスシステム社

学歴 2

  • 東北大学 工学研究科 電気・通信工学専攻

    ~ 2011年3月25日

  • 山形大学 工学部 情報科学科

    ~ 2006年3月25日

委員歴 2

  • 画像工学研究会 専門委員

    2019年6月 ~ 2023年6月

  • パターン認識・メディア理解研究会 専門委員

    2015年6月 ~ 2021年6月

所属学協会 2

  • IEEE

  • 電子情報通信学会

研究キーワード 3

  • 文書解析

  • 画像処理

  • パターン認識

研究分野 1

  • 情報通信 / 知覚情報処理 /

受賞 6

  1. インタラクティブ発表賞

    2024年8月 第27回 画像の認識・理解シンポジウム Domain Generalizable Multi-Targeted Adversarial Attack using Dynamic Loss Weighting

  2. インタラクティブ発表賞

    2024年8月 第27回 画像の認識・理解シンポジウム 生成画像を用いた工業画像マルチクラス分類と異常検知アルゴリズム性能との比較検証

  3. 石田實記念財団研究奨励賞

    2021年11月 一般財団法人石田實記念財団

  4. The Eighth International Conferences on Pervasive Patterns and Applications, Best Paper Award

    2016年3月22日 The Eighth International Conferences on Pervasive Patterns and Applications

  5. The Eighth International Conferences on Creative Content Technologies, Best Paper Award

    2016年3月22日 The Eighth International Conference on Creative Content Technologies

  6. IEEE Sendai Section, The Best Paper Prize

    2007年12月7日 IEEE Sendai Section

︎全件表示 ︎最初の5件までを表示

論文 86

  1. Semantically-Guided Image Compression for Enhanced Perceptual Quality at Extremely Low Bitrates 査読有り

    Shoma Iwai, Tomo Miyazaki, Shinichiro Omachi

    IEEE Access 12 100057-100072 2024年

    出版者・発行元: Institute of Electrical and Electronics Engineers (IEEE)

    DOI: 10.1109/access.2024.3430322  

    eISSN:2169-3536

  2. Japanese historical character recognition by focusing on character parts

    Takuru Ishikawa, Tomo Miyazaki, Shinichiro Omachi

    Pattern Recognition 110181-110181 2023年12月

    出版者・発行元: Elsevier BV

    DOI: 10.1016/j.patcog.2023.110181  

    ISSN:0031-3203

  3. A Scene-Text Synthesis Engine Achieved Through Learning from Decomposed Real-World Data 国際誌 査読有り

    Zhengmi Tang, Tomo Miyazaki, Shinichiro Omachi

    IEEE Transactions on Image Processing 2023年11月

    DOI: 10.1109/TIP.2023.3326685  

  4. Deep Image Compression Using Scene Text Quality Assessment 査読有り

    Shohei Uchigasaki, Tomo Miyazaki, Shinichiro Omachi

    Pattern Recognition 109696-109696 2023年5月

    出版者・発行元: Elsevier BV

    DOI: 10.1016/j.patcog.2023.109696  

    ISSN:0031-3203

  5. Important Region Estimation Using Image Captioning 査読有り

    IEEE Access 10 105546-105555 2022年10月

    出版者・発行元:

    DOI: 10.1109/access.2022.3211260  

    eISSN:2169-3536

  6. Stroke-Based Scene Text Erasing Using Synthetic Data for Training 国際誌 査読有り

    Zhengmi Tang, Tomo Miyazaki, Yoshihiro Sugaya, Shinichiro Omachi

    IEEE Transactions on Image Processing 30 9306-9320 2021年11月

    出版者・発行元: Institute of Electrical and Electronics Engineers (IEEE)

    DOI: 10.1109/tip.2021.3125260  

    ISSN:1057-7149

    eISSN:1941-0042

  7. A Framework for Estimating Gaze Point Information for Location-Based Services 査読有り

    Junpei Masuho, Tomo Miyazaki, Yoshihiro Sugaya, Masako Omachi, Shinichiro Omachi

    IEEE Transactions on Vehicular Technology 70 (9) 8468-8477 2021年9月

    出版者・発行元: Institute of Electrical and Electronics Engineers (IEEE)

    DOI: 10.1109/tvt.2021.3101932  

    ISSN:0018-9545

    eISSN:1939-9359

  8. Graph Neural Networks with Multiple Feature Extraction Paths for Chemical Property Estimation 国際誌 査読有り

    Sho Ishida, Tomo Miyazaki, Yoshihiro Sugaya, Shinichiro Omachi

    Molecules 26 (11) 3125-3125 2021年5月24日

    出版者・発行元:

    DOI: 10.3390/molecules26113125  

    eISSN:1420-3049

  9. Automatic Generation of Typographic Font From Small Font Subset 国際誌 査読有り

    Tomo Miyazaki, Tatsunori Tsuchiya, Yoshihiro Sugaya, Shinichiro Omachi, Masakazu Iwamura, Seiichi Uchida, Koichi Kise

    IEEE Computer Graphics and Applications 40 (1) 99-111 2020年1月1日

    出版者・発行元:

    DOI: 10.1109/mcg.2019.2931431  

    ISSN:0272-1716

    eISSN:1558-1756

  10. Object-Based Video Coding by Visual Saliency and Temporal Correlation 国際誌 査読有り

    Kazuya Ogasawara, Tomo Miyazaki, Yoshihiro Sugaya, Shinichiro Omachi

    IEEE Transactions on Emerging Topics in Computing 8 (1) 168-178 2020年1月1日

    出版者・発行元:

    DOI: 10.1109/tetc.2017.2695640  

    eISSN:2376-4562

  11. Automatic Mackerel Sorting Machine using Global and Local Features 国際誌 査読有り

    Yoshito Nagaoka, Tomo Miyazaki, Yoshihiro Sugaya, Shinichiro Omachi

    IEEE Access 7 (1) 63767-63777 2019年12月

    DOI: 10.1109/ACCESS.2019.2917554  

  12. Structural Data Recognition With Graph Model Boosting 国際誌 査読有り

    Tomo Miyazaki, Shinichiro Omachi

    IEEE Access 6 63606-63618 2018年

    出版者・発行元:

    DOI: 10.1109/access.2018.2876860  

    eISSN:2169-3536

  13. VQ-STE: Scene text erasing with mask refinement and vector-quantized texture dictionary

    Zhengmi Tang, Tomo Miyazaki, Zhijie Wang, Yongsong Huang, Jonathan Pradana Mailoa, Shinichiro Omachi

    Knowledge-Based Systems 315 113306-113306 2025年4月

    出版者・発行元: Elsevier BV

    DOI: 10.1016/j.knosys.2025.113306  

    ISSN:0950-7051

  14. Texture and noise dual adaptation for infrared image super-resolution

    Yongsong Huang, Tomo Miyazaki, Xiaofeng Liu, Yafei Dong, Shinichiro Omachi

    Pattern Recognition 111449-111449 2025年2月

    出版者・発行元: Elsevier BV

    DOI: 10.1016/j.patcog.2025.111449  

    ISSN:0031-3203

  15. Dual-Conditioned Training to Exploit Pre-Trained Codebook-Based Generative Model in Image Compression 国際誌 査読有り

    Shoma Iwai, Tomo Miyazaki, Shinichiro Omachi

    IEEE Access 12 198184-198200 2024年12月

    DOI: 10.1109/ACCESS.2024.3522238  

  16. Lightweight Reference-Based Video Super-Resolution Using Deformable Convolution

    Tomo Miyazaki, Zirui Guo, Shinichiro Omachi

    Information 15 (11) 718-718 2024年11月8日

    出版者・発行元: MDPI AG

    DOI: 10.3390/info15110718  

    eISSN:2078-2489

    詳細を見る 詳細を閉じる

    Super-resolution is a technique for generating a high-resolution image or video from a low-resolution counterpart by predicting natural and realistic texture information. It has various applications such as medical image analysis, surveillance, remote sensing, etc. However, traditional single-image super-resolution methods can lead to a blurry visual effect. Reference-based super-resolution methods have been proposed to recover detailed information accurately. In reference-based methods, a high-resolution image is also used as a reference in addition to the low-resolution input image. Reference-based methods aim at transferring high-resolution textures from the reference image to produce visually pleasing results. However, it requires texture alignment between low-resolution and reference images, which generally requires a lot of time and memory. This paper proposes a lightweight reference-based video super-resolution method using deformable convolution. The proposed method makes the reference-based super-resolution a technology that can be easily used even in environments with limited computational resources. To verify the effectiveness of the proposed method, we conducted experiments to compare the proposed method with baseline methods in two aspects: runtime and memory usage, in addition to accuracy. The experimental results showed that the proposed method restored a high-quality super-resolved image from a very low-resolution level in 0.0138 s using two NVIDIA RTX 2080 GPUs, much faster than the representative method.

  17. TAMC: Textual Alignment and Masked Consistency for Open-Vocabulary 3D Scene Understanding 査読有り

    24 (19) 6166-6166 2024年9月24日

    出版者・発行元:

    DOI: 10.3390/s24196166  

    eISSN:1424-8220

  18. Machine learning-based identification of the risk factors for postoperative nausea and vomiting in adults 査読有り

    Hiroshi Hoshijima, Tomo Miyazaki, Yuto Mitsui, Shinichiro Omachi, Masanori Yamauchi, Kentaro Mizuta

    PLOS ONE 19 (8) 1-15 2024年8月15日

    出版者・発行元: Public Library of Science (PLoS)

    DOI: 10.1371/journal.pone.0308755  

    eISSN:1932-6203

    詳細を見る 詳細を閉じる

    Postoperative nausea and vomiting (PONV) is a common adverse effect of anesthesia. Identifying risk factors for PONV is crucial because it is associated with a longer stay in the post-anesthesia care unit, readmissions, and perioperative costs. This retrospective study used artificial intelligence to analyze data of 37,548 adult patients (aged ≥20 years) who underwent surgery under general anesthesia at Tohoku University Hospital from January 1, 2010 to December 31, 2019. To evaluate PONV, patients who experienced nausea and/or vomiting or used antiemetics within 24 hours after surgery were extracted from postoperative medical and nursing records. We create a model that predicts probability of PONV using the gradient tree boosting model, which is a widely used machine learning algorithm in many applications due to its efficiency and accuracy. The model implementation used the LightGBM framework. Data were available for 33,676 patients. Total blood loss was identified as the strongest contributor to PONV, followed by sex, total infusion volume, and patient’s age. Other identified risk factors were duration of surgery (60–400 min), no blood transfusion, use of desflurane for maintenance of anesthesia, laparoscopic surgery, lateral positioning during surgery, propofol not used for maintenance of anesthesia, and epidural anesthesia at the lumbar level. The duration of anesthesia and the use of either sevoflurane or fentanyl were not identified as risk factors for PONV. We used artificial intelligence to evaluate the extent to which risk factors for PONV contribute to the development of PONV. Intraoperative total blood loss was identified as the potential risk factor most strongly associated with PONV, although it may correlate with duration of surgery, and insufficient circulating blood volume. The use of sevoflurane and fentanyl and the anesthesia time were not identified as risk factors for PONV in this study.

  19. Learn from orientation prior for radiograph super-resolution: Orientation operator transformer 国際誌 国際共著 査読有り

    Yongsong Huang, Tomo Miyazaki, Xiaofeng Liu, Kaiyuan Jiang, Zhengmi Tang, Shinichiro Omachi

    Computer Methods and Programs in Biomedicine 245 2024年3月

    DOI: 10.1016/j.cmpb.2023.108000  

  20. IRSRMamba: Infrared Image Super-Resolution via Mamba-based Wavelet Transform Feature Modulation Model.

    Yongsong Huang, Tomo Miyazaki, Xiaofeng Liu 0001, Shinichiro Omachi

    CoRR abs/2405.09873 2024年

    DOI: 10.48550/arXiv.2405.09873  

  21. JPEG Image Enhancement with Pre-Processing of Color Reduction and Smoothing 国際誌 査読有り

    Akane Shoda, Tomo Miyazaki, Shinichiro Omachi

    Sensors 23 (21) 2023年10月

    DOI: 10.3390/s23218861  

  22. Collaborative Indoor Positioning by Localization Comparison at an Encounter Position 国際誌 査読有り

    Kohei Kageyama, Tomo Miyazaki, Yoshihiro Sugaya, Shinichiro Omachi

    Applied Sciences 13 (12) 2023年6月

    DOI: 10.3390/app13126962  

  23. Target-oriented Domain Adaptation for Infrared Image Super-Resolution.

    Yongsong Huang, Tomo Miyazaki, Xiaofeng Liu, Yafei Dong, Shinichiro Omachi

    CoRR abs/2311.08816 2023年

    DOI: 10.48550/arXiv.2311.08816  

  24. Comparative Pulse Shape Discrimination Study for Ca(Br, I)2 Scintillators Using Machine Learning and Conventional Methods 査読有り

    1045 167626-167626 2023年1月

    出版者・発行元:

    DOI: 10.1016/j.nima.2022.167626  

    ISSN:0168-9002

  25. GAN-based Privacy-Conscious Data Augmentation with Finger-Vein Images 査読有り

    Yusuke Matsuda, Tomo Miyazaki, Shinichiro Omachi

    2022 IEEE International Conference on Artificial Intelligence in Engineering and Technology (IICAIET) 2022年9月13日

    出版者・発行元:

    DOI: 10.1109/iicaiet55139.2022.9936860  

  26. Infrared Image Super-Resolution: Systematic Review, and Future Trends.

    Yongsong Huang, Tomo Miyazaki, Xiaofeng Liu, Shinichiro Omachi

    CoRR abs/2212.12322 2022年

    DOI: 10.48550/arXiv.2212.12322  

  27. Importance Estimation for Scene Texts Using Visual Features 査読有り

    28 (1) 15-23 2022年

    出版者・発行元:

    DOI: 10.4036/iis.2022.a.06  

    ISSN:1340-9050

    eISSN:1347-6157

  28. Self Texture Transfer Networks for Low Bitrate Image Compression 査読有り

    Shoma Iwai, Tomo Miyazaki, Yoshihiro Sugaya, Shinichiro Omachi

    Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) Workshops 2021年6月

    DOI: 10.1109/CVPRW53098.2021.00214  

  29. Multiple Visual-Semantic Embedding for Video Retrieval from Query Sentence 国際誌 査読有り

    Huy Manh Nguyen, Tomo Miyazaki, Yoshihiro Sugaya, Shinichiro Omachi

    Applied Sciences 11 (7) 3214-3214 2021年4月3日

    出版者・発行元:

    DOI: 10.3390/app11073214  

    eISSN:2076-3417

  30. Text Detection Using Multi-Stage Region Proposal Network Sensitive to Text Scale 国際誌 査読有り

    Yoshito Nagaoka, Tomo Miyazaki, Yoshihiro Sugaya, Shinichiro Omachi

    Sensors 21 (4) 1232-1232 2021年2月9日

    出版者・発行元:

    DOI: 10.3390/s21041232  

    eISSN:1424-8220

  31. Fidelity-Controllable Extreme Image Compression with Generative Adversarial Networks 査読有り

    Shoma Iwai, Tomo Miyazaki, Yoshihiro Sugaya, Shinichiro Omachi

    Proceedings of the 25th International Conference on Pattern Recognition (ICPR 2020) 8235-8242 2021年1月

    DOI: 10.1109/ICPR48806.2021.9412185  

  32. Mackerel Fat Content Estimation Using RGB and Depth Images

    Shuya Sano, Tomo Miyazaki, Yoshihiro Sugaya, Naohiro Sekiguchi, Shinichiro Omachi

    IEEE Access 9 164060-164069 2021年

    出版者・発行元: Institute of Electrical and Electronics Engineers (IEEE)

    DOI: 10.1109/access.2021.3134260  

    eISSN:2169-3536

  33. Optical Flow-Based Fast Motion Parameters Estimation for Affine Motion Compensation 国際誌 査読有り

    Antoine Chauvet, Yoshihiro Sugaya, Tomo Miyazaki, Shinichiro Omachi

    Appllied Sciences 10 (2) 2020年1月

    DOI: 10.3390/app10020729  

  34. Super Resolution for Multi Frames with 3D Feature Extraction and RNN Prediction 査読有り

    Xi Huang, Tomo Miyazaki, Yoshihiro Sugaya, Shinichiro Omachi

    2019 International Symposium on Signal Processing Systems Proceedings (SSPS 2019) 2019年9月

    DOI: 10.1145/3364908.3364909  

  35. Fast Image Quality Enhancement for HEVC by Postfiltering via Shallow Neural Networks 査読有り

    Antoine Chauvet, Tomo Miyazaki, Yoshihiro Sugaya, Shinichiro Omachi

    IIEEJ Transactions on Image Electronics and Visual Computing 7 (1) 2-12 2019年6月

  36. 環境中文字認識を利用した情報提供アプリケーションのためのウェアラブルシステムの開発 査読有り

    菅谷至寛, 坂井清士郎, 宮崎 智, 大町真一郎

    画像電子学会誌 48 (2) 248-257 2019年4月

  37. Text Detection by Faster R-CNN with Multiple Region Proposal Networks 査読有り

    Yoshito Nagaoka, Tomo Miyazaki, Yoshihiro Sugaya, Shinichiro Omachi

    Proceedings of the International Conference on Document Analysis and Recognition, ICDAR 6 15-20 2018年1月25日

    出版者・発行元: IEEE Computer Society

    DOI: 10.1109/ICDAR.2017.343  

    ISSN:1520-5363

  38. Glyph-Based Data Augmentation for Accurate Kanji Character Recognition 査読有り

    Kenichiro Ofusa, Tomo Miyazaki, Yoshihiro Sugaya, Shinichiro Omachi

    Proceedings of the International Conference on Document Analysis and Recognition, ICDAR 1 597-602 2018年1月25日

    出版者・発行元: IEEE Computer Society

    DOI: 10.1109/ICDAR.2017.103  

    ISSN:1520-5363

  39. Mackerel Classification using Global and Local Features 査読有り

    Yoshito Nagaoka, Tomo Miyazaki, Yoshihiro Sugaya, Shinichiro Omachi

    Proceedings of the 2018 IEEE 23rd International Conference on Emerging Technologies and Factory Automation 1209-1212 2018年

  40. Activity Recognition Using Gazed Text and Viewpoint Information for User Support Systems 査読有り

    Shun Chiba, Tomo Miyazaki, Yoshihiro Sugaya, Shinichiro Omachi

    Journal of Sensor and Actuator Networks 7 (3) 2018年

    DOI: 10.3390/jsan7030031  

  41. Automatic Discrimination between Scomber japonicus and Scomber australasicus by Geometric and Texture Features 査読有り

    Airi Kitasato, Tomo Miyazaki, Yoshihiro Sugaya, Shinichiro Omachi

    Fishes 3 (3) 2018年

    DOI: 10.3390/fishes3030026  

  42. Text retrieval for Japanese historical documents by image generation 査読有り

    Chisato Sugawara, Yoshihiro Sugaya, Tomo Miyazaki, Shinichiro Omachi

    ACM International Conference Proceeding Series 19-24 2017年11月10日

    出版者・発行元: Association for Computing Machinery

    DOI: 10.1145/3151509.3151512  

  43. A Preliminary Study on Location Estimation without Preparation using Ceiling Signboard 査読有り

    Yoshihiro Sugaya, Kento Takeda, Tomo Miyazaki, Shinichiro Omachi

    Proceedings of International Conference on Indoor Positioning and Indoor Navigation 2017年9月

  44. Adaptive Post Filter for Reducing Block Artifacts in High Efficiency Video Coding 査読有り

    Antoine Chauvet, Tomo Miyazaki, Yoshihiro Sugaya, Shinichiro Omachi

    Proceedings - 2016 International Conference on Multimedia Systems and Signal Processing, ICMSSP 2016 22-25 2017年6月9日

    出版者・発行元: Institute of Electrical and Electronics Engineers Inc.

    DOI: 10.1109/ICMSSP.2016.014  

  45. Development of Wearable System for Translation of Japanese Texts in the Environment 査読有り

    Kiyoshiro Sakai, Yoshihiro Sugaya, Tomo Miyazaki, Shinichiro Omachi

    Proceedings of International Workshop on Frontiers of Computer Vison 2017年2月

  46. Analysis of Floor Map Image in Information Board for Indoor Navigation 査読有り

    Tomoya Honto, Yoshihiro Sugaya, Tomo Miyazaki, Shinichiro Omachi

    2017 INTERNATIONAL CONFERENCE ON INDOOR POSITIONING AND INDOOR NAVIGATION (IPIN) 2017年

    DOI: 10.1109/IPIN.2017.8115896  

    ISSN:2162-7347

  47. Efficient coding for video including text using image generation 査読有り

    Yosuke Nozue, Tomo Miyazaki, Yoshihiro Sugaya, Shinichiro Omachi

    Journal of Information Processing 24 (2) 330-338 2016年3月15日

    出版者・発行元: Information Processing Society of Japan

    DOI: 10.2197/ipsjjip.24.330  

    ISSN:1882-6652 0387-5806

  48. Indoor Localization by Map Matching Using One Image of Guide Plate 査読有り

    Kento Tonosaki, Yoshihiro Sugaya, Tomo Miyazaki, Shinichiro Omachi

    The Eighth International Conferences on Pervasive Patterns and Applications (PATTERNS 2016) 2016年3月

  49. Indoor Localization by Map Matching Using One Image of Information Board 査読有り

    Kento Tonosaki, Toshihiro Sugaya, Tomo Miyazaki, Shinichiro Omachi

    The Eighth International Conferences on Pervasive Patterns and Applications 2016年3月

  50. Object-based Video Coding for Arbitrary Shape by Visual Saliency and Temporal Correlation 査読有り

    Kazuya Ogasawara, Tomo Miyazaki, Yoshihiro Sugaya, Shinichiro Omachi

    The Eighth International Conference on Creative Content Technologies 2016年3月

  51. Discrimination of Scomber Japonicus and Scomber Australasicus by Dorsal Fin Length and Fork Length 査読有り

    Airi Kitasato, Tomo Miyazaki, Yoshihiro Sugaya, Shinichiro Omachi

    The Korea-Japan joint workshop on Frontiers of Computer Vision 2016 338-341 2016年2月

  52. 補助線を用いた情景画像からの高精度文字領域抽出 査読有り

    川村思織, 宮崎 智, 菅谷至寛, 大町真一郎

    画像電子学会学会誌 45 (1) 62-70 2016年2月

    出版者・発行元: 一般社団法人 画像電子学会

    DOI: 10.11371/iieej.45.62  

    ISSN:2186-716X

    詳細を見る 詳細を閉じる

    情景画像中の文字を認識する需要が高まっているが,不均一な照明や複雑な背景,影などにより,文字を正確に検出して認識することは未だに困難な問題である.高精度な文字検出を実現するために,スマートフォンやタブレットなどのタッチ操作が可能なデバイスを用い,ユーザが補助線などの補助情報を与える手法が提案されている.本論文でもこの考え方を採用し,ユーザが補助線により画像中の文字の位置を大まかに指定し,その情報をもとに文字色の推定を行うことで文字領域を高精度に抽出する手法を提案する.提案手法により,複雑な背景の画像や明るさが不均一な画像でも画素単位で高い精度での文字領域抽出を行うことができることを公開データベースを用いた実験により示す.

  53. Precise character region extraction from scene images using auxiliary lines

    Shiori Kawamura, Tomo Miyazaki, Yoshihiro Sugaya, Shinichiro Omachi

    Journal of the Institute of Image Electronics Engineers of Japan 45 (1) 62-70 2016年

    出版者・発行元: Institute of Image Electronics Engineers of Japan

    ISSN:1348-0316 0285-9831

  54. 補助線を用いた情景画像からの高精度文字領域抽出 査読有り

    川村 思織, 宮崎 智, 菅谷 至寛, 大町 真一郎

    画像電子学会誌 45 (1) 62-70 2016年1月

  55. スパースコーディングを用いたテキストを含む画像符号化に関する検討

    井上 慶祐, 宮崎 智, 菅谷 至寛, 大町 真一郎

    電子情報通信学会技術研究報告 116 (119) 5-10 2016年

  56. Improvement of Map Matching for Indoor Navigation Exploiting Photo of Information Board 査読有り

    Kento Tonosaki, Yoshihiro Sugaya, Tomo Miyazaki, Shinichiro Omachi

    Proceedings of International Conference on Indoor Positioning and Indoor Navigation 22-26 2016年

  57. Graph Model Boosting for Structural Data Recognition 査読有り

    Tomo Miyazaki, Shinichiro Omachi

    2016 23RD INTERNATIONAL CONFERENCE ON PATTERN RECOGNITION (ICPR) 1707-1712 2016年

    DOI: 10.1109/ICPR.2016.7899882  

    ISSN:1051-4651

  58. 顕著性マップとGrabCutによる注目物体抽出を用いた動画像符号化

    小笠原和也, 宮崎 智, 菅谷至寛, 大町真一郎

    平成27年度電気関係学会東北支部連合大会講演論文集 2015 115-115 2015年8月27日

    出版者・発行元: 電気関係学会東北支部連合大会実行委員会

    DOI: 10.11528/tsjc.2015.0_115  

  59. 電子基板の欠陥検査のための文字認識

    吉田大樹, 宮崎 智, 菅谷至寛, 大町真一郎

    平成27年度電気関係学会東北支部連合大会講演論文集 2015 128-128 2015年8月27日

    出版者・発行元: 電気関係学会東北支部連合大会実行委員会

    DOI: 10.11528/tsjc.2015.0_128  

  60. Accuracy Improvement of Character Recognition Using Generated Samples by Morphing

    Shuto Shinbo, Tomo Miyazaki, Yoshihiro Sugaya, Shinichiro Omachi

    平成27年度電気関係学会東北支部連合大会講演論文集 2015 31-31 2015年8月27日

    出版者・発行元: 電気関係学会東北支部連合大会実行委員会

    DOI: 10.11528/tsjc.2015.0_31  

  61. Gaze Detection in Omnidirectional Scene by Iterative Image Matching

    Shun Chiba, Tomo Miyazaki, Yoshihiro Sugaya, Shinichiro Omachi

    平成27年度電気関係学会東北支部連合大会講演論文集 2015 30-30 2015年8月27日

    出版者・発行元: 電気関係学会東北支部連合大会実行委員会

    DOI: 10.11528/tsjc.2015.0_30  

  62. Survey of Guide Plates and Fundamental Study of Map Image Analysis for Indoor Navigation

    Kento Tonosaki, Yoshihiro Sugaya, Tomo Miyazaki, Shinichiro Omachi

    平成27年度電気関係学会東北支部連合大会講演論文集 2015 127-127 2015年8月27日

    出版者・発行元: 電気関係学会東北支部連合大会実行委員会

    DOI: 10.11528/tsjc.2015.0_127  

  63. 屋内ナビゲーションのための案内板画像解析に関する研究

    外崎 健人, 菅谷 至寛, 宮崎 智, 大町 真一郎

    電子情報通信学会2015年総合大会 学生ポスターセッション 115-115 2015年3月

  64. アイトラッカと全方位カメラを用いた環境中の視点位置推定

    千葉 駿, 宮崎 智, 菅谷至寛, 大町真一郎

    電子情報通信学会技術研究報告 114 (454) 101-102 2015年2月12日

    出版者・発行元: 一般社団法人電子情報通信学会

  65. ストローク幅特徴を用いた情景画像中の文字検出

    大島康嗣, 宮崎 智, 菅谷至寛, 大町真一郎

    電子情報通信学会技術研究報告 114 (454) 99-100 2015年2月12日

    出版者・発行元: 一般社団法人電子情報通信学会

  66. 画像抽象化による分割圧縮効果改善の検討

    石森亮輔, 宮崎 智, 菅谷至寛, 大町真一郎

    電子情報通信学会技術研究報告 114 (454) 97-98 2015年2月12日

    出版者・発行元: 一般社団法人電子情報通信学会

  67. 動画像を用いた超低解像度文字認識

    鳥羽修平, 工藤裕貴, 宮崎 智, 菅谷至寛, 大町真一郎

    電子情報通信学会技術研究報告 114 (454) 95-96 2015年2月12日

    出版者・発行元: 一般社団法人電子情報通信学会

  68. Ultra-low Resolution Character Recognition System with Pruning Mutual Subspace Method 査読有り

    Shuhei Toba, Hirotaka Kudo, Tomo Miyazaki, Yoshihiro Sugaya, Shinichiro Omachi

    2015 IEEE INTERNATIONAL CONFERENCE ON CONSUMER ELECTRONICS - TAIWAN (ICCE-TW) 284-285 2015年

    DOI: 10.1109/ICCE-TW.2015.7216900  

  69. Estimation of Gazing Points in Environment Using Eye Tracker and Omnidirectional Camera 査読有り

    Shun Chiba, Tomo Miyazaki, Yoshihiro Sugaya, Shinichiro Omachi

    2015 IEEE INTERNATIONAL CONFERENCE ON CONSUMER ELECTRONICS - TAIWAN (ICCE-TW) 47-48 2015年

    DOI: 10.1109/ICCE-TW.2015.7217003  

  70. Finding Stroke Parts for Rough Text Detection in Scene Images with Random Forest 査読有り

    Tomo Miyazaki, Shinichiro Omachi

    Proceedings of Joint Conference of IWAIT and IFMIA 2015年

  71. オブジェクトベースの符号化のための画像抽象化を用いた分割圧縮

    石森亮輔, 宮崎 智, 菅谷至寛, 大町真一郎

    2014年画像符号化シンポジウム予稿集 2014年11月

  72. 文字パラメータを利用した動画像中の文字の高効率符号化

    野末洋佑, 宮崎 智, 菅谷至寛, 大町真一郎

    2014年画像符号化シンポジウム予稿集 2014年11月

  73. A Video Coding Method for Scene Text

    Yosuke Nozue, Tomo Miyazaki, Yoshihiro Sugaya, Shinichiro Omachi

    平成26年度電気関係学会東北支部連合大会講演論文集 2014年8月21日

  74. Ultra-Low Resolution Character Recognition with Increased Training Data and Image Enhancement

    Shuhei Toba, Hirotaka Kudo, Tomo Miyazaki, Yoshihiro Sugaya, Shinichiro Omachi

    平成26年度電気関係学会東北支部連合大会講演論文集 2014年8月21日

  75. Automatic Generation of Kanji Fonts from Sample Designs

    Tatsunori Tsuchiya, Tomo Miyazaki, Yoshihiro Sugaya, Shinichiro Omachi

    平成26年度電気関係学会東北支部連合大会講演論文集 2014年8月21日

  76. ぼけ除去及び複数フレームを利用した超低解像度文字認識

    鳥羽 修平, 工藤 裕貴, 宮崎 智, 菅谷 至寛, 大町 真一郎

    2014年 画像の認識・理解シンポジウム (MIRU2014) 2014年7月

  77. サンプルデザインからの漢字フォントの自動生成

    土屋 達徳, 宮崎 智, 菅谷 至寛, 大町 真一郎

    2014年 画像の認識・理解シンポジウム (MIRU2014) 2014年7月

  78. 効率的な映像符号化のための画像抽象化法の比較検討

    石森 亮輔, 宮崎 智, 菅谷 至寛, 大町 真一郎

    電子情報通信学会2014年総合大会 学生ポスターセッション 251-251 2014年3月

  79. 補助線を利用した文字領域抽出

    川村思織, 宮崎 智, 菅谷至寛, 大町真一郎

    電子情報通信学会技術研究報告 113 (431) 119-120 2014年2月6日

    出版者・発行元: 一般社団法人電子情報通信学会

  80. Representative Graph Generation for Graph-Based Character Recognition 査読有り

    Tomo Miyazaki, Shinichiro Omachi

    Journal of the Institute of Image Electronics Engineers of Japan 40 (3) 439-447 2011年

    DOI: 10.11371/iieej.40.439  

    ISSN:1348-0316 0285-9831

  81. Fast method for extracting representative graph from decorative character images 査読有り

    Tomo Miyazaki, Shinichiro Omachi

    Proceedings - 2010 2nd IEEE International Conference on Network Infrastructure and Digital Content, IC-NIDC 2010 219-223 2010年

    DOI: 10.1109/ICNIDC.2010.5657776  

  82. 共通拡大グラフによる飾り文字画像群からの文字構造抽出

    宮崎 智, 大町真一郎, 阿曽弘具

    画像の認識・理解シンポジウム2009講演論文集 506-512 2009年7月20日

  83. Extraction of Representative Structure of Decorative Character Images 査読有り

    Tomo Miyazaki, Shinichiro Omachi, Hirotomo Aso

    PROCEEDINGS OF THE 2009 CHINESE CONFERENCE ON PATTERN RECOGNITION AND THE FIRST CJK JOINT WORKSHOP ON PATTERN RECOGNITION, VOLS 1 AND 2 944-+ 2009年

    DOI: 10.1109/CCPR.2009.5343952  

  84. 重み付き最小共通スーパーグラフを用いたシルエット画像認識 査読有り

    宮崎 智, 大町 真一郎, 阿曽 弘具

    画像電子学会誌 38 (5) 640-647 2009年

    DOI: 10.11371/iieej.38.640  

    ISSN:1348-0316 0285-9831

  85. 重み付き最小共通スーパーグラフによるシルエット画像の構造抽出

    宮崎 智, 大町真一郎, 阿曽弘具

    画像の認識・理解シンポジウム2008講演論文集 1408-1413 2008年7月29日

  86. Extraction of Structure of Silhouette Images by Weighted Minimum Common Supergraph 査読有り

    Tomo Miyazaki, Shinichiro Omachi, Hirotomo Aso

    Proceedings of the Second Korea-Japan Joint Workshop on Pattern Recognition 107 (281) 45-49 2007年

    出版者・発行元: 一般社団法人電子情報通信学会

    ISSN:0913-5685

    詳細を見る 詳細を閉じる

    It is desired to recognize objects which are distorted or rotated in images. Since it is difficult to recognize those objects by template matching in images, recognition using graph has been studied. A graph extracted by medial axis transform to a digital silhouette image is not always a graph which represents the essential structure that distincts silhouettes in a category, because of noise and distortion. Our aim in this paper is to extract the essential structure of silhouette. We propose a method to extract the structure by weighted minimum common supergraph. To show the validity of the proposed method, experiments are carried out for categorizing silhouette images using the extracted structure.

︎全件表示 ︎最初の5件までを表示

MISC 25

  1. 天吊り案内板を用いた屋内ナビゲーション手法の検討

    竹村 貴文, 菅谷 至寛, 宮崎 智, 大町 真一郎

    平成30年度電気関係学会東北支部連合大会講演論文集 2A07 2018年

  2. 監視カメラを活用したユーザの実世界位置の推定

    増保 純平, 宮崎 智, 菅谷 至寛, 大町 真一郎

    平成30年度電気関係学会東北支部連合大会講演論文集 1I05 2018年

  3. 超解像を用いた動画像符号化に関する検討

    桑野 拓朗, 宮崎 智, 菅谷 至寛, 大町 真一郎

    平成30年度電気関係学会東北支部連合大会講演論文集 1D14 2018年

  4. Multi-Frame Super Resolution Using 3D Convolution and RNN Prediction

    黄 希, 宮崎 智, 菅谷 至寛, 大町 真一郎

    平成30年度電気関係学会東北支部連合大会講演論文集 2F12 2018年

  5. ユーザ入力の補助線による情景画像からの高精度文字抽出

    宮崎智, 川村思織, 菅谷至寛, 大町 真一郎

    画像ラボ 28 (10月) 37-42 2017年10月

    出版者・発行元: 日本工業出版

    ISSN: 0915-6755

  6. 重要度を考慮した情景画像中における文字情報抽出

    大平 康太, 宮崎 智, 菅谷 至寛, 大町 真一郎

    電子情報通信学会総合大会学生ポスターセッション ISS-SP-199 2017年

  7. スパースコーディングを用いた動画像符号化に関する検討

    八重樫 日菜子, 宮崎 智, 菅谷 至寛, 大町 真一郎

    電子情報通信学会総合大会学生ポスターセッション ISS-SP-200 2017年

  8. Determining Important Objects in Scene Image Using Neural Networks

    佐藤 大亮, 宮崎 智, 菅谷 至寛, 大町 真一郎

    平成29年度電気関係学会東北支部連合大会講演論文集 2017 2B12-158 2017年

    出版者・発行元: 電気関係学会東北支部連合大会実行委員会

    DOI: 10.11528/tsjc.2017.0_158  

  9. Efficient Coding for Video Including Text Using Image Generation

    Yosuke Nozue, Tomo Miyazaki, Yoshihiro Sugaya, Shinichiro Omachi

    情報処理学会論文誌 57 (3) 2016年3月15日

    ISSN: 1882-7764

    詳細を見る 詳細を閉じる

    Text in video compressed by lossy compression at a low bitrate will easily be deteriorated, resulting in blurred text and a lower readability. In this paper, we propose a novel image coding method to preserve the readability of text in the video at a very low bitrate. During the encoding process, we estimate the parameters for each character of the text. Then, an image without text is generated and compressed. During the decoding process, we reconstruct video sequences with text from images without text and character images generated by the estimated parameters. The experimental results show the effectiveness of the proposed method in terms of the readability at a very low bitrate.\n------------------------------This is a preprint of an article intended for publication Journal ofInformation Processing(JIP). This preprint should not be cited. Thisarticle should be cited as: Journal of Information Processing Vol.24(2016) No.2 (online)DOI http://dx.doi.org/10.2197/ipsjjip.24.330------------------------------Text in video compressed by lossy compression at a low bitrate will easily be deteriorated, resulting in blurred text and a lower readability. In this paper, we propose a novel image coding method to preserve the readability of text in the video at a very low bitrate. During the encoding process, we estimate the parameters for each character of the text. Then, an image without text is generated and compressed. During the decoding process, we reconstruct video sequences with text from images without text and character images generated by the estimated parameters. The experimental results show the effectiveness of the proposed method in terms of the readability at a very low bitrate.\n------------------------------This is a preprint of an article intended for publication Journal ofInformation Processing(JIP). This preprint should not be cited. Thisarticle should be cited as: Journal of Information Processing Vol.24(2016) No.2 (online)DOI http://dx.doi.org/10.2197/ipsjjip.24.330------------------------------

  10. 非線形最小化によるグラフのモデルの構築と画像認識

    酒井 利晃, 宮崎 智, 菅谷 至寛, 大町 真一郎

    電子情報通信学会2016年総合大会講演論文集 D-12-96 2016年

  11. Graph Learning with Quadratic Programming in Consideration of Class Diversity

    Toshiaki Sakai, Tomo Miyazaki, Yoshihiro Sugaya, Shinichiro Omachi

    画像の認識・理解シンポジウム PS2-42 2016年

  12. 顕著性を利用した情景画像からの重要な文字列の検出

    大平 康太, 宮崎 智, 菅谷 至寛, 大町 真一郎

    画像の認識・理解シンポジウム PS3-42 2016年

  13. パーツの生成による少数サンプルからのフォント生成

    景山 竣, 宮崎 智, 菅谷 至寛, 大町 真一郎

    画像の認識・理解シンポジウム PS3-08 2016年

  14. Signboard Extraction and Recognition in Subway Station Premises

    Kenta Takeda, Yoshihiro Sugaya, Tomo Miyazaki, Shinichiro Omachi

    平成28年度電気関係学会東北支部連合大会講演論文集 2016 1A03-3 2016年

    出版者・発行元: 電気関係学会東北支部連合大会実行委員会

    DOI: 10.11528/tsjc.2016.0_3  

  15. Low Resolution Character Recognition Using Convolutional Neural Networks

    Kyoko Maeda, Tomo Miyazaki, Yoshihiro Sugaya, Shinichiro Omachi

    平成28年度電気関係学会東北支部連合大会講演論文集 1A04 2016年

  16. 文字認識を利用した環境中の日本語英字翻訳を行うウェアラブルシステムの開発

    坂井 清士郎, 宮崎 智, 菅谷 至寛, 大町 真一郎

    平成28年度電気関係学会東北支部連合大会講演論文集 2016 2G04-205 2016年

    出版者・発行元: 電気関係学会東北支部連合大会実行委員会

    DOI: 10.11528/tsjc.2016.0_205  

  17. Detection of a Key String from Scene Images Using Saliency

    Kota Oodaira, Tomo Miyazaki, Yoshihiro Sugaya, Shinichiro Omachi

    International Workshop on Emerging ICT 2016年

  18. Investigation of Convolutional Neural Network Structure for Low Resolution Character Recognition

    Kyoko Maeda, Tomo Miyazaki, Yoshihiro Sugaya, Shinichiro Omachi

    International Workshop on Emerging ICT 2016年

  19. Automatic Synthesis of Character Pattern Using Patch Transform

    Jian Wang, Hiroya Saito, Tomo Miyazaki, Yoshihiro Sugaya, Shinichiro Omachi

    Proceedings of the International Workshop on Electronics and Communications 2014年

  20. Rough Detection of Text in Scene Images by Finding Stroke Parts

    Tomo Miyazaki, Shinichiro Omachi

    Proceedings of the International Workshop on Electronics and Communications 2014年

  21. Extracting Representative Graph of Decorative Character Images by Random Method

    Tomo Miyazaki, Shinichiro Omachi

    Proceedings of the Third Student Organizing International Mini-Conference on Information Electronics Systems 67-68 2010年

  22. Iterative Extraction of Representative Graph Using Common Features from Decorative Character Images

    Tomo Miyazaki, Shinichiro Omachi

    Proceedings of the Second Student Organizing International Mini-Conference on Information Electronics Systems 85-86 2009年

  23. Extraction of Structure of Shapes Using Weighted Minimum Common Supergraph

    Tomo Miyazaki, Shinichiro Omachi, Hirotomo Aso

    Proceedings of the China-Korea-Japan Graduates Workshop on Electronic Information 49-50 2008年

  24. Structure Extraction from Silhouette Images by Weighted Minimum Common Supergraph

    Tomo Miyazaki, Shinichiro Omachi, Hirotomo Aso

    Proceedings of the First Student Organizing International Mini-Conference on Information Electronics Systems 75-76 2008年

  25. Silhouette Image Recognition

    Tomo Miyazaki, Shinichiro Omachi, Hirotomo Aso

    Proceedings of the Third Korea-Japan Joint Workshop on Pattern Recognition 13-14 2008年

︎全件表示 ︎最初の5件までを表示

講演・口頭発表等 1

  1. Recent Advances in Image Processing by Artificial Intelligence 国際会議

    Tomo Miyazaki

    International Workshop on Emerging ICT 2018年11月5日

    詳細を見る 詳細を閉じる

    With the rise of deep learning, artificial Intelligent becomes a buzzword, which we see this word almost everyday in televisions, newspapers, blogs, or books. Artificial intelligence brought tremendous progresses to a wide of research areas. This talk describes what the artificial intelligence is and introduces recent advance in the field of image processing by the deep learning.

産業財産権 1

  1. 情報端末、位置推定方法、および位置推定プログラム

    菅谷 至寛, 外崎 健人, 大町 真一郎, 宮崎 智

    産業財産権の種類: 特許権

共同研究・競争的資金等の研究課題 10

  1. 人工知能を応用した自動麻酔制御システムの構築

    星島 宏, 宮崎 智, 大町 真一郎, 水田 健太郎

    2022年4月1日 ~ 2025年3月31日

  2. 機械学習に適した本質的な文字構造の理解によるくずし字認識

    宮崎 智

    提供機関:Japan Society for the Promotion of Science

    制度名:Grants-in-Aid for Scientific Research Grant-in-Aid for Scientific Research (C)

    研究種目:Grant-in-Aid for Scientific Research (C)

    研究機関:Tohoku University

    2022年4月1日 ~ 2025年3月31日

  3. ロボット鎮静システムの開発

    水田 健太郎, 大町 真一郎, 宮崎 智, 飯島 毅彦, 星島 宏

    提供機関:Japan Society for the Promotion of Science

    制度名:Grants-in-Aid for Scientific Research Grant-in-Aid for Challenging Research (Exploratory)

    研究種目:Grant-in-Aid for Challenging Research (Exploratory)

    研究機関:Tohoku University

    2021年7月9日 ~ 2024年3月31日

    詳細を見る 詳細を閉じる

    近年、医療現場における鎮静麻酔の利用件数は増加の一途を辿っており、歯科治療、消化管内視鏡検査、MRI検査などの際に利用されている。しかし、 麻酔科医のマンパワーは世界的に不足しており、鎮静麻酔の大多数が麻酔管理に不慣れな非麻酔科医により実施されている。本研究では、麻酔科医が経験則で行っている鎮静の麻酔深度の調節を、分析力と予測力を兼ね備えた人工知能に置き換え、患者の特性、鎮静中の呼吸状態、患者の鎮静深度に合わせて鎮静薬の投与速度を自動制御するロボット鎮静システムを開発するものである。特に、上気道閉塞をはじめとする鎮静中の有害事象の発生を事前に予測・予防しながら個々の患者の身体的特性(身長、体重、年齢、性別、基礎疾患、常用薬、飲酒歴など)に応じて鎮静薬(プロポフォール、ミダゾラム)の投与量・時期を自動制御することを目標に掲げ、本年度は以下の研究を中心に行った。 鎮静麻酔データの新規収集:東北大学病院において静脈内鎮静法(静脈麻酔)を受ける患者を対象に、鎮静麻酔管理中に収集された生体情報モニタのデータ(血圧、心拍数、脈拍数、SpO2、呼吸数、EtCO2、BIS値、軽胸壁インピーダンス)を数値データとして抽出した。 データの機械学習:鎮静麻酔データを教師データとともに人工知能に機械学習させ、鎮静薬投与の自動制御アルゴリズムの構築を開始した。具体的には、数十秒後に起こるバイタルサイン変動を予測する手法の開発を進めた。

  4. デフォルメされたマップでのユーザー指向な屋内ナビゲーションの実現

    菅谷 至寛, 宮崎 智, 大町 真一郎

    提供機関:Japan Society for the Promotion of Science

    制度名:Grants-in-Aid for Scientific Research Grant-in-Aid for Scientific Research (C)

    研究種目:Grant-in-Aid for Scientific Research (C)

    研究機関:Tohoku University

    2021年4月 ~ 2024年3月

    詳細を見る 詳細を閉じる

    研究代表者らは、掲示されたフロアマップとスマートフォン内蔵のセンサだけで、施設管理者の協力がなくても屋内ナビを実現できる「ユーザー指向」な手法の研究開発を行ってきたが、デフォルメされ歪みの大きいマップも存在する。そのようなマップはこれまでの手法では対応できないことがわかっており、本研究課題ではユーザの負担にならない方法で歪みのあるマップに対応できる手法を開発することを目的としている。 当該年度では、歪みのあるマップでの推定精度を改善するために、マップマッチングに用いる粒子フィルタの処理の改良を行った。交差点や曲がり角のマップ上での位置と、方向転換ステップの推定位置を利用して縮尺を求めて保存しておき、粒子の縮尺の候補として利用する。また、マップの縮尺が一様でない場合に、位置と縮尺の両方について同時に正しいパラメータを持つ粒子が存在する確率は非常に低いが、各々は正しい場合が少なくないという観察に基づき、方向転換時に粒子のパラメータをシャッフルする手法を提案した。これらにより、多くの歪みのあるマップでの位置推定精度が向上した。 また、従来手法でもマップの小さなデフォルメに対応するために通路方向を利用していたが、広場領域において粒子の進みすぎ、進まなすぎが発生していた。この問題に対処するために、粒子の方位を補正する新しい手法を提案した。この手法では補正の閾値と量を通路の確信度によって動的に変化させ、無理のない補正を行う。これによって、従来よりも高い推定精度が得られることを実験によって確認した。

  5. 重要領域検出による超高圧縮映像符号化技術の開発

    大町 真一郎, 宮崎 智, 菅谷 至寛, 大町 方子

    提供機関:Japan Society for the Promotion of Science

    制度名:Grants-in-Aid for Scientific Research Grant-in-Aid for Scientific Research (B)

    研究種目:Grant-in-Aid for Scientific Research (B)

    研究機関:Tohoku University

    2020年4月 ~ 2023年3月

    詳細を見る 詳細を閉じる

    生成されるデータの量は保存できるストレージの量を超えており、データの重要性の判定は今後ますます重要な技術となる。特に画像データや映像データはデータ量が大きい反面冗長性も高く、重要なデータのみを効率よく保存または伝送する技術はこれらのデータを有効活用する上で極めて重要である。本研究では、画像や映像から重要領域を検出し、画像や映像としての価値や必要な情報を損なわずに高圧縮を実現する技術を開発することを目的としている。 映像の意味を理解することにより重要領域を検出するために、イメージキャプショニングを利用する手法を開発した。すなわち、映像を説明する文章を生成し、文章の意味を解析することにより重要な領域や重要度を推定する。前年度までは主に文章の主語に注目したが、今年度は主語に加え目的語も考慮することでより適切に重要領域を検出する手法を開発した。キャプションの文章と画像の特徴マップを対応させることで重要領域を特定する。そして、既存の画像データセットに重要度の情報を付加したデータセットを構築し、提案手法がどの程度人間の感性と一致しているかを評価した。 一方で、環境中のテキストが人間にとって重要な情報を与えることから、テキストの重要度を判定する手法についても検討を行った。テキストの重要度を表すデータベースを構築し、画像特徴を用いて機械学習によりテキストの重要度を推定する手法を開発した。さらに、テキストの領域は可読性を保証するために特に高い解像度が必要となることを考慮し、可読性を判断する手法についても検討を行った。 また、重要領域の品質を保持したままデータサイズを削減する手法として、画像生成を用いた手法を開発した。重要領域はそのまま残し、それ以外の部分については敵対的生成ネットワークを用いた画像生成の技術で元の画像を復元する。セマンティックマップを活用することで精度を向上させることに成功した。

  6. 統計的グラフ解析による分子構造の解析と応用

    宮崎 智

    提供機関:Japan Society for the Promotion of Science

    制度名:Grants-in-Aid for Scientific Research Grant-in-Aid for Scientific Research (C)

    研究種目:Grant-in-Aid for Scientific Research (C)

    研究機関:Tohoku University

    2019年4月 ~ 2022年3月

    詳細を見る 詳細を閉じる

    情報通信の発達により、インターネット上に様々な大規模分子科学データが構築されている。これら大規模な分子データから有用な知識(例えば薬理活性を決定する分子構造)を発見することが期待されている。しかし、その発見は一般的に専門家に頼っており、大規模データからの重要構造の自動抽出は挑戦的な課題である。本研究は、大規模な分子データを基に、分子の化学的特性を決める重要な構造を統計的に自動解析する手法を開発した。主な成果として、深層学習による分子の化学的特性を高精度に推定する手法を開発し、物理化学などの分子の解析に有効であることを示した。さらに、分子解析法を画像処理に活用して、魚の脂肪率推定を行った。

  7. カメラを持たないビジョン技術への挑戦

    大町 真一郎, 菅谷 至寛, 宮崎 智

    提供機関:Japan Society for the Promotion of Science

    制度名:Grants-in-Aid for Scientific Research Challenging Research (Exploratory)

    研究種目:Challenging Research (Exploratory)

    研究機関:Tohoku University

    2018年6月 ~ 2021年3月

    詳細を見る 詳細を閉じる

    ユーザがカメラを持ち歩く代わりに監視カメラ等の既設の固定カメラを利用し、その映像とユーザの行動を結びつけることでビジョン技術を活用するための基盤技術を開発している。本年度は主に、固定カメラを利用してユーザの位置・姿勢を推定する手法について検討した。具体的には、実世界に対応した俯瞰マップを用意し、動画像上の座標をマップ座標に変換をすることで位置推定を行う。動画像中の人物位置を、物体検出手法を応用することで検出する。物体検出には、ニューラルネットワークを用いた手法を採用し、学習によって精度を向上させる。そして、その人物の足元の座標を座標変換により求め、立っている位置を特定する。さらに、人物の視線を知るために、頭部方向を推定する。そのためにウェアラブルセンサの出力を用いる。メガネ型デバイスを用い、このデバイスに内蔵されているセンサの出力により人物の異動の加速度および角速度を推定し、頭部の方向を推定する。そして、実際に研究室内の環境で測定を行い、位置推定および頭部方向推定がある程度可能であることを確認した。また、これとは別に、環境中の文字認識を利用した情報提供アプリケーションのためのウェアラブルシステムについて検討した。認識結果の提示方法、ユーザインタフェース、どのようなアプリケーションがユーザにとって有益かなどについて、主観評価実験を行い評価した。その結果、ユーザに提示する情報およびユーザインタフェースの設計についてある程度の見通しを得た。

  8. どこでも歩行者ナビ:事前データ収集を必要としない歩行者ナビゲーションの開発

    菅谷 至寛, 大町 真一郎, 宮崎 智

    提供機関:Japan Society for the Promotion of Science

    制度名:Grants-in-Aid for Scientific Research Grant-in-Aid for Scientific Research (C)

    研究種目:Grant-in-Aid for Scientific Research (C)

    研究機関:Tohoku University

    2018年4月 ~ 2021年3月

    詳細を見る 詳細を閉じる

    本研究では,測位インフラやマップ等の事前準備なしでの屋内歩行者ナビゲーションを実現することを目指しており,人間が利用するために提供されている案内表示板等の情報を利用する.施設の出入口やエレベーター・エスカレータ付近に設置されている案内板にはフロアマップを含んでいることが多く,これをスマートフォンのカメラで撮影して解析・理解することで,ナビゲーションに必要な電子マップをその場で獲得する.また,マップ中に記載されている地下街の出入口番号や店名などの情報とシーン画像を照合することによって大まかな位置推定を行い,相対的な位置の変化を推定できる歩行者デッドレコニングと組み合わせる. フロアマップからの通路領域の解析はこれまでの準備研究である程度可能になっていたが,発見的手法を用いていたため様々なバリエーションのフロアマップに十分に対応できていなかった.さらに,地図領域の大まかな指定を手動で行う必要もあった.本年度は深層学習を用いたフロアマップ解析手法に取り組み,精度やロバスト性を向上させるとともに,地図領域の指定を不要とした. また,画像解析によって取得したマップは方位や縮尺が不明であり,従来は開始時に2か所以上の絶対位置との対応を手動で(画面をタップすることで)得ていた.これはユーザーにとって負担となるため,手動による位置の指定を不要にする手法を検討した.初期位置はフロアマップを撮影した場所であるが,マップ内には現在地が表示されていることが多く,これを認識することで自動で対応を取ることができる.深層学習を用いた手法を検討し,多くの場合に正しく認識できることを確認した.また,ここで求めたいものは初期パラメータであって高い精度が必要ないことに着目し,エレベータの大きさをヒントとして縮尺を推定する手法も検討した.

  9. 視認性を保証する映像の超高圧縮技術の開発

    大町 真一郎, 菅谷 至寛, 宮崎 智, 大町 方子

    提供機関:Japan Society for the Promotion of Science

    制度名:Grants-in-Aid for Scientific Research Grant-in-Aid for Scientific Research (B)

    研究種目:Grant-in-Aid for Scientific Research (B)

    研究機関:Tohoku University

    2016年4月 ~ 2019年3月

    詳細を見る 詳細を閉じる

    映像の品質を重要な情報の視認性と捉え、映像に応じて映像としての価値や必要な情報を損なわずに超高圧縮を実現する技術を開発した。成果は大きく分けて2つある。1つは重要な領域の検出法であり、視覚的顕著性を利用した手法と、映像の意味を解析してその結果を用いる手法を提案した。もう1つは効率の良い圧縮法であり、スパースコーディングを用いた手法、画像生成技術を応用した手法、超解像を利用した手法を提案した。

  10. グラフマッチングによる非剛体を対象とした柔軟かつ高精度な認識

    宮崎 智

    提供機関:Japan Society for the Promotion of Science

    制度名:Grants-in-Aid for Scientific Research Grant-in-Aid for Research Activity start-up

    研究種目:Grant-in-Aid for Research Activity start-up

    研究機関:Tohoku University

    2015年8月 ~ 2017年3月

    詳細を見る 詳細を閉じる

    グラフは非剛体のような柔軟に変形するパターンを表現することが可能であるが,画像を利用した物体認識にはほとんど用いられてこなかった.これは,画像から物体を表すグラフを構築することが極めて困難であることと,グラフを利用して画像の類似度を測る方法が確立されていないことが原因である. 本研究では,画像中の特徴点から物体のグラフを抽出し,グラフの確率モデルを用いて画像中の物体を認識する手法を提案した.さらに,複数の確率モデルを用いることで,認識性能を大幅に向上できることを解明した.これらの要素技術はパターン認識の分野におけるグラフの新たな活用法を開拓するもので,産業的,学術的に非常に大きな意味を持つ.

︎全件表示 ︎最初の5件までを表示

担当経験のある科目(授業) 5

  1. 電気回路学基礎論

  2. 電気回路学基礎演習

  3. アドバンス創造工学研修

  4. 創造工学研修

  5. データベース 東北工業大学

社会貢献活動 2

  1. 秋田高校出張講義

    2024年5月29日 ~ 2024年5月29日

  2. 人工知能と画像処理技術

    高大連携事業に係る地域公開講座

    2023年10月17日 ~ 2023年10月17日

学術貢献活動 6

  1. Publicity Chairs, The International Conference on Document Analysis and Recognition (ICDAR)

    2017年 ~

    学術貢献活動種別: 大会・シンポジウム等

  2. Program Committee Member, International Workshop on Historical Document Imaging and Processing (HIP)

    2015年 ~ 継続中

    学術貢献活動種別: 大会・シンポジウム等

  3. Program Committee Member, IJCAI-PRICAI

    2020年 ~ 2021年

    学術貢献活動種別: 学会・研究会等

  4. 組織 副委員長 第23回 画像の認識・理解シンポジウム

    2020年 ~

  5. MIRU2019 若手プログラム委員

    2019年 ~

    学術貢献活動種別: 大会・シンポジウム等

  6. Program Committee Member, The 16th International Conference on Frontiers in Handwriting Recognition (ICFHR)

    2018年 ~

    学術貢献活動種別: 大会・シンポジウム等

︎全件表示 ︎最初の5件までを表示