研究者詳細

顔写真

アカミネ マサミ
赤嶺 政巳
Masami Akamine
所属
高等大学院機構 高等大学院機構・学位プログラム推進センター
職名
教授
学位
  • 工学博士(東北大学)

  • 工学修士(東北大学)

e-Rad 研究者番号
91034700

経歴 14

  • 2025年11月 ~ 継続中
    東北大学 高等大学院機構 教授

  • 2019年4月 ~ 2025年10月
    東北大学 大学院工学研究科 特任教授

  • 2018年4月 ~ 2019年3月
    東芝研究開発センター・メディアAIラボラトリー シニアフェロー

  • 2016年4月 ~ 2019年3月
    慶應義塾大学理工学研究科 非常勤特任教授

  • 2015年4月 ~ 2018年3月
    東芝リサーチ・コンサルティング シニアフェロー

  • 2005年4月 ~ 2015年3月
    東芝研究開発センター 技監

  • 2004年4月 ~ 2005年3月
    東芝研究開発センター・特別研究室 研究主幹

  • 2002年4月 ~ 2004年3月
    東芝研究開発センター 研究企画室グループ長

  • 2000年4月 ~ 2002年3月
    東芝研究開発センター・マルチメディアラボラトリー 室長

  • 2000年4月 ~ 2001年3月
    和歌山大学大学院システム工学研究科 非常勤講師

  • 1997年4月 ~ 2000年3月
    東芝研究開発センター・関西研究所 ラボリーダー

  • 1994年4月 ~ 1997年3月
    東芝研究開発センター・情報通信システム研究所 主任研究員

  • 1989年4月 ~ 1994年3月
    東芝研究開発センター・情報通信システム研究所 研究主務

  • 1985年4月 ~ 1989年3月
    東芝総合研究所(平成4年から研究開発センターに改名)・電子機器研究所 研究員

︎全件表示 ︎最初の5件までを表示

学歴 2

  • 東北大学 大学院工学研究科博士後期課程 電子工学専攻

    1982年4月 ~ 1985年3月

  • 東北大学 大学院工学研究科博士前期課程 情報工学専攻

    1980年4月 ~ 1982年3月

所属学協会 4

  • 電子情報通信学会名誉員

    2022年6月 ~ 継続中

  • APSIPA (Asia Pacific Signal and Information Processing Association)

    2008年1月 ~ 継続中

  • ISCA (International Speech Communication Association)

    2003年1月 ~ 継続中

  • IEEE

    1984年1月 ~ 2023年12月

研究キーワード 6

  • 機械学習

  • ディジタル信号処理

  • 音声対話

  • 音声符号化

  • 音声認識

  • 音声合成

研究分野 1

  • 情報通信 / ヒューマンインタフェース、インタラクション / 音声処理

受賞 10

  1. 功績賞

    2020年6月 電子情報通信学会

  2. 紫綬褒章

    2013年4月 内閣府

  3. 業績賞

    2012年5月 電子情報通信学会

  4. 全国発明表彰内閣総理大臣発明賞

    2008年6月 発明協会

  5. 連作論文賞

    2003年9月 電子情報通信学会

  6. 市村産業賞功績賞

    2003年4月 新技術開発財団

  7. 技術開発賞

    2002年5月 日本音響学会

  8. 文部科学大臣賞研究功績者

    2001年4月 文部科学省

  9. テレコムシステム技術賞

    2001年3月 電気通信普及財団

  10. 篠原記念学術奨励賞

    1989年3月 電子情報通信学会

︎全件表示 ︎最初の5件までを表示

論文 60

  1. Dialog State Tracking for Unseen Values Using an Extended Attention Mechanism

    Takami Yoshida, Kenji Iwata, Hiroshi Fujimura, Masami Akamine

    9TH INTERNATIONAL WORKSHOP ON SPOKEN DIALOGUE SYSTEM TECHNOLOGY 579 77-89 2019年

    DOI: 10.1007/978-981-13-9443-0_7  

    ISSN:1876-1100

    eISSN:1876-1119

  2. OUT-OF-DOMAIN SLOT VALUE DETECTION FOR SPOKEN DIALOGUE SYSTEMS WITH CONTEXT INFORMATION

    Yuka Kobayashi, Takami Yoshida, Kenji Iwata, Hiroshi Fujimura, Masami Akamine

    2018 IEEE WORKSHOP ON SPOKEN LANGUAGE TECHNOLOGY (SLT 2018) 854-861 2018年

    ISSN:2639-5479

  3. Near and Far Field Speech-in-Noise Intelligibility Improvements Based on a Time-Frequency Energy Reallocation Approach

    Tudor-Catalin Zorila, Yannis Stylianou, Tatsuma Ishihara, Masami Akamine

    IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING 24 (10) 1808-1818 2016年10月

    DOI: 10.1109/TASLP.2016.2585864  

    ISSN:2329-9290

    eISSN:2329-9304

  4. Statistical Bandwidth Extension for Speech Synthesis Based on Gaussian Mixture Model with Sub-Band Basis Spectrum Model

    Yamato Ohtani, Masatsune Tamura, Masahiro Morita, Masami Akamine

    IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS E99D (10) 2481-2489 2016年10月

    DOI: 10.1587/transinf.2016SLP0006  

    ISSN:1745-1361

  5. Voice Activity Detection: Merging Source and Filter-based Information

    Thomas Drugman, Yannis Stylianou, Yusuke Kida, Masami Akamine

    IEEE SIGNAL PROCESSING LETTERS 23 (2) 252-256 2016年2月

    DOI: 10.1109/LSP.2015.2495219  

    ISSN:1070-9908

    eISSN:1558-2361

  6. Emotional transplant in statistical speech synthesis based on emotion additive model

    Yaniato Ohtani, Yu Nasu, Masahiro Morita, Masami Akamine

    16TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2015), VOLS 1-5 274-278 2015年

  7. A Maximum Likelihood Approach to the Detection of Moments of Maximum Excitation and its Application to High-Quality Speech Parameterization

    Ranniery Maia, Yannis Stylianou, Masami Akamine

    16TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2015), VOLS 1-5 603-607 2015年

  8. On the impact of excitation and spectral parameters for expressive statistical parametric speech synthesis

    Ranniery Maia, Masami Akamine

    COMPUTER SPEECH AND LANGUAGE 28 (5) 1209-1232 2014年9月

    DOI: 10.1016/j.csl.2013.10.001  

    ISSN:0885-2308

    eISSN:1095-8363

  9. Building HMM-TTS Voices on Diverse Data

    Vincent Wan, Javier Latorre, Kayoko Yanagisawa, Norbert Braunschweiler, Langzhou Chen, Mark J. F. Gales, Masami Akamine

    IEEE JOURNAL OF SELECTED TOPICS IN SIGNAL PROCESSING 8 (2) 296-306 2014年4月

    DOI: 10.1109/JSTSP.2013.2295058  

    ISSN:1932-4553

    eISSN:1941-0484

  10. Integrated Expression Prediction and Speech Synthesis From Text

    Langzhou Chen, Mark J. F. Gales, Norbert Braunschweiler, Masami Akamine, Kate Knill

    IEEE JOURNAL OF SELECTED TOPICS IN SIGNAL PROCESSING 8 (2) 323-335 2014年4月

    DOI: 10.1109/JSTSP.2013.2294938  

    ISSN:1932-4553

    eISSN:1941-0484

  11. Complex cepstrum for statistical parametric speech synthesis

    Ranniery Maia, Masami Akamine, Mark J. F. Gales

    SPEECH COMMUNICATION 55 (5) 606-618 2013年6月

    DOI: 10.1016/j.specom.2012.12.008  

    ISSN:0167-6393

    eISSN:1872-7182

  12. Minimum mean squared error based warped complex cepstrum analysis for statistical parametric speech synthesis

    Ranniery Maia, Mark J. F. Gales, Yannis Stylianou, Masami Akamine

    14TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2013), VOLS 1-5 2335-2339 2013年

    ISSN:2308-457X

  13. Photo-Realistic Expressive Text to Talking Head Synthesis

    Vincent Wan, Robert Anderson, Art Blokland, Norbert Braunschweiler, Langzhou Chen, BalaKrishna Kolluru, Javier Latorre, Ranniery Maia, Bjoern Stenger, Kayoko Yanagisawa, Yannis Stylianou, Masami Akamine, Mark J. F. Gales, Roberto Cipolla

    14TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2013), VOLS 1-5 2666-2668 2013年

    ISSN:2308-457X

  14. TRAINING A SUPRA-SEGMENTAL PARAMETRIC F0 MODEL WITHOUT INTERPOLATING F0

    Javier Latorre, Mark J. F. Gales, Kate Knill, Masami Akamine

    2013 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP) 6880-6884 2013年

    ISSN:1520-6149

  15. COMPLEX CEPSTRUM ANALYSIS BASED ON THE MINIMUM MEAN SQUARED ERROR

    Ranniery Maia, Masami Akamine, M. J. F. Gales

    2013 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP) 7972-7976 2013年

    ISSN:1520-6149

  16. INTEGRATED AUTOMATIC EXPRESSION PREDICTION AND SPEECH SYNTHESIS FROM TEXT

    Langzhou Chen, Mark J. F. Gales, Norbert Braunschweiler, Masami Akamine, Kate Knill

    2013 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP) 7977-7981 2013年

    ISSN:1520-6149

  17. Decision tree-based acoustic models for speech recognition

    Masami Akamine, Jitendra Ajmera

    EURASIP JOURNAL ON AUDIO SPEECH AND MUSIC PROCESSING 2012年

    DOI: 10.1186/1687-4722-2012-10  

    ISSN:1687-4722

  18. COMPLEX CEPSTRUM AS PHASE INFORMATION IN STATISTICAL PARAMETRIC SPEECH SYNTHESIS

    Ranniery Maia, Masami Akamine, M. J. F. Gales

    2012 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP) 4581-4584 2012年

    ISSN:1520-6149

  19. Exploring Rich Expressive Information from Audiobook Data Using Cluster Adaptive Training

    Langzhou Chen, Mark J. F. Gales, Vincent Wan, Javier Latorre, Masami Akamine

    13TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2012 (INTERSPEECH 2012), VOLS 1-3 958-961 2012年

  20. Speech factorization for HMM-TTS based on cluster adaptive training.

    Javier Latorre, Vincent Wan, Mark J. F. Gales, Langzhou Chen, K. K. Chin, Kate Knill, Masami Akamine

    13TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2012 (INTERSPEECH 2012), VOLS 1-3 970-973 2012年

  21. Combining multiple high quality corpora for improving HMM-TTS

    Vincent Wan, Javier Latorre, K. K. Chin, Langzhou Chen, Mark J. F. Gales, Heiga Zen, Kate Knill, Masami Akamine

    13TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2012 (INTERSPEECH 2012), VOLS 1-3 1134-1137 2012年

  22. Histogram-based spectral equalization for HMM-based speech synthesis using mel-LSP

    Yamato Ohtani, Masatsune Tamura, Masahiro Morita, Takehiko Kagoshima, Masami Akamine

    13TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2012 (INTERSPEECH 2012), VOLS 1-3 1154-1157 2012年

  23. HMM-based speech synthesis using sub-band basis spectrum model

    Yamato Ohtani, Masatsune Tamura, Masahiro Morita, Takehiko Kagoshima, Masami Akamine

    13TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2012 (INTERSPEECH 2012), VOLS 1-3 1438-1441 2012年

  24. Analysis on the Importance of Short-Term Speech Parameterizations for Emotional Statistical Parametric Speech Synthesis

    Ranniery Maia, Masami Akamine

    13TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2012 (INTERSPEECH 2012), VOLS 1-3 1630-1633 2012年

  25. Decision Tree-Based Acoustic Models for Speech Recognition with Improved Smoothness

    Masami Akamine, Jitendra Ajmera

    IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS E94D (11) 2250-2258 2011年11月

    DOI: 10.1587/transinf.E94.D.2250  

    ISSN:1745-1361

  26. CONTINUOUS F0 IN THE SOURCE-EXCITATION GENERATION FOR HMM-BASED TTS: DO WE NEED VOICEDIUNVOICED CLASSIFICATION?

    Javier Latorre, Mark J. F. Gales, Sabine Buchholz, Kate Knill, Masatsune Tamura, Yamato Ohtani, Masami Akamine

    2011 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING 4724-4727 2011年

    ISSN:1520-6149

  27. ONE SENTENCE VOICE ADAPTATION USING GMM-BASED FREQUENCY-WARPING AND SHIFT WITH A SUB-BAND BASIS SPECTRUM MODEL

    Masatsune Tamura, Masahiro Morita, Takehiko Kagoshima, Masami Akamine

    2011 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING 5124-5127 2011年

    ISSN:1520-6149

  28. COVARIANCE CLUSTERING ON RIEMANNIAN MANIFOLDS FOR ACOUSTIC MODEL COMPRESSION

    Yusuke Shinohara, Takashi Masuko, Masami Akamine

    2010 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING 4326-4329 2010年

    DOI: 10.1109/ICASSP.2010.5495661  

    ISSN:1520-6149

  29. UNIT SELECTION SPEECH SYNTHESIS USING MULTIPLE SPEECH UNITS AT NON-ADJACENT SEGMENTS FOR PROSODY AND WAVEFORM GENERATION

    Masatsune Tamura, Norbert Braunschweiler, Takehiko Kagoshima, Masami Akamine

    2010 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING 4802-4805 2010年

    DOI: 10.1109/ICASSP.2010.5495151  

    ISSN:1520-6149

  30. Sub-band Basis Spectrum Model for Pitch-synchronous Log-spectrum and Phase Based on Approximation of Sparse Coding

    Masatsune Tamura, Takehiko Kagoshima, Masami Akamine

    11TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2010 (INTERSPEECH 2010), VOLS 3 AND 4 2406-2409 2010年

  31. BAYESIAN FEATURE ENHANCEMENT USING A MIXTURE OF UNSCENTED TRANSFORMATIONS FOR UNCERTAINTY DECODING OF NOISY SPEECH

    Yusuke Shinohara, Masami Akamine

    2009 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOLS 1- 8, PROCEEDINGS 4569-4572 2009年

    DOI: 10.1109/ICASSP.2009.4960647  

    ISSN:1520-6149

  32. Decision Tree Acoustic Models for ASR

    Jitendra Ajmera, Masami Akamine

    INTERSPEECH 2009: 10TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2009, VOLS 1-5 1379-1382 2009年

  33. Feedback Loop for Prosody Prediction in Concatenative Speech Synthesis.

    Javier Latorre, Sergio Gracia, Masami Akamine

    INTERSPEECH 2009: 10TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2009, VOLS 1-5 2027-2030 2009年

  34. Speech Recognition using Soft Decision Trees

    Jitendra Ajmera, Masami Akamine

    INTERSPEECH 2008: 9TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2008, VOLS 1-5 940-943 2008年

  35. Comparative Evaluation of Different Methods for Voice Activity Detection

    Hongfei Ding, Koichi Yamamoto, Masami Akamine

    INTERSPEECH 2008: 9TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2008, VOLS 1-5 107-110 2008年

  36. Multilevel parametric-base F0 model for speech synthesis

    Javier Latorre, Masami Akamine

    INTERSPEECH 2008: 9TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2008, VOLS 1-5 2274-2277 2008年

  37. Feature enhancement by speaker-normalized splice for robust speech recognition

    Yusuke Shinohara, Takashi Masuko, Masami Akamine

    2008 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING, VOLS 1-12 4881-4884 2008年

    ISSN:1520-6149

  38. HMM-based Speech Recognition Using Decision Trees Instead of GMMs

    Remco Teunen, Masami Akamine

    INTERSPEECH 2007: 8TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION, VOLS 1-4 617-620 2007年

  39. 閉ループ学習に基づく最適な音声素片の解析的生成

    篭嶋岳彦, 赤嶺政巳

    電子情報通信学会論文誌 D-2 J83-D-2 (6) 2000年

    ISSN:0915-1923

  40. Toshiba English Text-to-Speech System (TESS) 査読有り

    C. K. Suh, T. Kagoshima, M. Morita, S. Seto, M. Akamine

    Proc. Eurospeech99 2111-2114 1999年

  41. CELP speech coding based on an adaptive pulse position codebook 査読有り

    T. Amada, K. Miseki, M. Akamine

    IEEE Proc. ICASSP99 13-16 1999年

  42. Analytic Generation of Synthesis Units by Closed Loop Training for Totally Speaker Driven Text to Speech System (TOS Drive TTS) 査読有り

    M. Akamine, T. Kagoshima

    1927-1930 1998年

  43. An F0 Contour Control Model for Totally Speaker Driven Text to Speech System 査読有り

    T. Kagoshima, M. Morita, S. Seto, M. Akamine

    IEEE Proc. ICSLP98 1975-1978 1998年

  44. Automatic Rule Generation for Linguistic Features Analysis Using Inductive Learning Technique-Linguistic Features Analysis in TOS Drive TTS System 査読有り

    S. Seto, M. Morita, T. Kagoshima, M. Akamine

    IEEE Proc. ICSLP98 2031-2034 1998年

  45. A 2.4 Kbps Variable Bit Rate ADP-CELP Speech Coder 査読有り

    M. Oshikiri, M. Akamine

    IEEE Proc. ICASSP 1 517-520 1998年

  46. 閉ループ学習に基づく代表素片選択による音声素片の自動生成

    篭嶋岳彦, 赤嶺政巳

    電子情報通信学会論文誌 D-2 J81-D-2 (9) 1998年

    ISSN:0915-1923

  47. 2.4kbps可変レートADP-CELP音声符号化

    押切正浩, 赤嶺政巳

    電子情報通信学会論文誌 A J81-A (11) 1998年

    ISSN:0913-5707

  48. Automatic Generation of Speech Synthesis Units Based on Closed Loop Training 査読有り

    T. Kagoshima, M. Akamine

    IEEE Proc. ICASSP97 2 963-966 1997年

  49. CELP音声符号化における目標ベクトルの直交化に基づいた励振符号帳の高速探索

    天田皇, 赤嶺政巳, 三関公生

    電子情報通信学会論文誌 A 79 (5) 1996年

    ISSN:0913-5707

  50. Adaptive Density Pulse Excitation for Low Bit Rate Speech Coding 査読有り

    Masami Akamine, Kimio Miseki

    IEICE Trans. E78 (2) 199-207 1995年2月

  51. Improvement of ADP-CELP Speech Coding at 4 Kbits/s 査読有り

    M. Akamine, K. Miseki, M. Oshikiri

    IEEE Proc. GLOBECOM 1869-1873 1991年

  52. Efficient Excitation Model for Low Bit Rate Speech Coding

    M. Akamine, K. Miseki

    IEEE Proc. ISCAS 586-589 1991年

  53. Adaptive Bit-Allocation between the Pole-Zero Synthesis Filter and Excitation in CELP 査読有り

    K. Miseki, M. Akamine

    229-232 1991年

  54. DCTを用いた画像符号化における完全再生可能なDCT演算精度

    菊池義池, 赤嶺政巳

    電子情報通信学会論文誌 A 74 (7) 1991年

    ISSN:0913-5707

  55. CELP Coding with an Adaptive Density Pulse Excitation Model

    M. Akamine, K. Miseki

    IEEE Proc. ICASSP 29-32 1990年

  56. ARMA Model Based Speech Coding at 8 kb/s 査読有り

    M. Akamine, K. Miseki

    IEEE Proc. ICASSP 148-151 1989年

  57. 浮動小数点演算を用いたリミットサイクルのない演算誤差最小ディジタルフィルタのクラスについて

    赤嶺政巳, 樋口龍雄

    電子情報通信学会論文誌 A 70 (5) 1987年

    ISSN:0913-5707

  58. State-Space Approach to Synthesis of Minimum Quantization Error Digital Filter Using Floating-Point Arithmetic 査読有り

    M. Akamine, T. Higuchi

    IEEE Proc. ISCAS 3 1002-1005 1984年3月

  59. 浮動小数点演算を用いた量子化誤差最小ディジタルフィルタの合成 査読有り

    赤嶺政巳, 樋口龍雄

    電子情報通信学会論文誌 A 66 (10) 895-902 1983年10月

  60. 浮動小数点演算を用いたディジタルフィルタの状態方程式に基づく量子化誤差解析 査読有り

    樋口龍雄, 赤嶺政巳

    電子情報通信学会論文誌 A 66 (3) 186-193 1983年3月

︎全件表示 ︎最初の5件までを表示

MISC 68

  1. 遠隔マイクで集音した音声の認識精度を向上させる残響抑圧技術

    籠嶋岳彦, KIM Uihyun, 赤嶺政巳

    東芝レビュー(Web) 73 (5) 2018年

    ISSN: 2432-1168

  2. 平静音声から予測した感情付与モデルに基づく統計的感情音声合成

    大谷大和, 那須悠, 森田眞弘, 赤嶺政巳

    日本音響学会研究発表会講演論文集(CD-ROM) 2015 2015年

    ISSN: 1880-7658

  3. サブバンド基底スペクトルモデルを利用した統計的帯域拡張法

    大谷大和, 田村正統, 森田眞弘, 赤嶺政巳

    電子情報通信学会技術研究報告 114 (52(SP2014 1-45)) 2014年

    ISSN: 0913-5685

  4. 表情豊かな音声と顔画像を合成するシステムXpressiveTalkの開発

    森中亮, 那須悠, 田村正統, WAN Vincenty, 柳澤佳代子, STENGER Bjorn, 森田眞弘, 籠嶋岳彦, 赤嶺政巳

    日本音響学会研究発表会講演論文集(CD-ROM) 2014 2014年

    ISSN: 1880-7658

  5. サブバンド基底スペクトルモデルを用いたGMMに基づく帯域拡張

    大谷大和, 田村正統, 森田眞弘, 赤嶺政巳

    日本音響学会研究発表会講演論文集(CD-ROM) 2014 2014年

    ISSN: 1880-7658

  6. HMM音声合成における加算モデルに基づく任意話者への感情付与法の検討

    大谷大和, 那須悠, 森中亮, 田村正統, 森田眞弘, 赤嶺政巳

    日本音響学会研究発表会講演論文集(CD-ROM) 2014 2014年

    ISSN: 1880-7658

  7. HMMに基づく感情音声合成のための共有感情付与モデル

    大谷大和, 那須悠, 森中亮, 田村正統, 森田眞弘, 赤嶺政巳

    電子情報通信学会技術研究報告 114 (303(SP2014 90-105)) 2014年

    ISSN: 0913-5685

  8. サブバンド基底スペクトルモデルを用いたHMM音声合成

    大谷大和, 田村正統, 森田眞弘, 籠嶋岳彦, 赤嶺政巳

    日本音響学会研究発表会講演論文集(CD-ROM) 2013 2013年

    ISSN: 1880-7658

  9. 身近になった音声処理技術と東芝の取組み

    赤嶺政巳

    東芝レビュー 68 (9) 2013年

    ISSN: 0372-0462

  10. 東芝の音声合成技術-閉ループ学習から最近の取り組みまで-

    赤嶺政巳

    電子情報通信学会技術研究報告 113 (366(SP2013 82-95)) 2013年

    ISSN: 0913-5685

  11. HMM音声合成による英語音声合成システムの開発

    田村正統, KRSTULOVIC Sacha, 森中亮, 徳田龍太郎, 全炳河, 森田眞弘, 籠嶋岳彦, 赤嶺政巳

    日本音響学会研究発表会講演論文集(CD-ROM) 2011 2011年

    ISSN: 1880-7658

  12. リーマン幾何学に基づく共分散クラスタリングによる音響モデルの圧縮

    篠原雄介, 益子貴史, 赤嶺政巳

    日本音響学会研究発表会講演論文集(CD-ROM) 2010 2010年

    ISSN: 1880-7658

  13. 耐雑音音声認識のためのアンセンテッド変換を用いた特徴強調法

    篠原雄介, 赤嶺政巳

    日本音響学会研究発表会講演論文集(CD-ROM) 2009 2009年

    ISSN: 1880-7658

  14. 雑音にロバストな音声と非音声の判別技術

    山本幸一, 赤嶺政巳

    東芝レビュー 64 (12) 2009年

    ISSN: 0372-0462

  15. 閉ループ学習に基づく音声素片および基本周波数制御規則の生成

    篭智岳彦, 赤嶺政巳, 瀬戸重宣, 森田真弘, 志賀芳則

    電子情報通信学会技術研究報告 103 (632(SP2003 170-174)) 2004年

    ISSN: 0913-5685

  16. FWFモデルを用いたピッチ波形の閉ループ学習

    篭嶋岳彦, 赤嶺政巳

    日本音響学会研究発表会講演論文集 2003 2003年

    ISSN: 1340-3168

  17. スペクトル包絡を制御するためのピッチ波形のモデリング

    篭嶋岳彦, 赤嶺政巳

    日本音響学会研究発表会講演論文集 2003 2003年

    ISSN: 1340-3168

  18. コンパクトなテキスト音声合成システムの開発

    清水勇詞, 瀬戸重宣, 篭嶋岳彦, 赤嶺政巳

    日本音響学会研究発表会講演論文集 2002 2002年

    ISSN: 1340-3168

  19. TOS-Drive TTSの米・英・独・仏・中国語への応用

    平林剛, 森田真弘, 徳田龍太郎, 篭嶋岳彦, 赤嶺政巳

    日本音響学会研究発表会講演論文集 2002 2002年

    ISSN: 1340-3168

  20. 合成辞書作成に用いる音声DBの品質が合成音声に与える影響について

    瀬戸重宣, 篭嶋岳彦, 土谷勝美, 赤嶺政巳

    日本音響学会研究発表会講演論文集 2002 2002年

    ISSN: 1340-3168

  21. サブバンド閉ループ学習による音声素片の生成

    篭嶋岳彦, 赤嶺政巳

    日本音響学会研究発表会講演論文集 2002 2002年

    ISSN: 1340-3168

  22. 音素HMMを環境適応的に選択して用いた競合モデルによる環境雑音のリジェクション

    小柴亮典, 酒井優, 天田皇, 河村聡典, 正井康之, 赤嶺政巳

    日本音響学会研究発表会講演論文集 2002 2002年

    ISSN: 1340-3168

  23. 代表パターンコードブックを用いた基本周波数制御法

    篭嶋岳彦, 森田真弘, 瀬戸重宣, 赤嶺政巳, 志賀芳則

    電子情報通信学会論文誌 D-2 J85-D-2 (6) 2002年

    ISSN: 0915-1923

  24. 多言語音声認識エンジンの開発

    出口豊, 金沢博史, 赤嶺政巳

    日本音響学会研究発表会講演論文集 2002 2002年

    ISSN: 1340-3168

  25. ITS(高度道路交通システム) 車載マルチメディア

    前田賢一, 赤嶺政巳, 加瀬直樹

    東芝レビュー 55 (1) 2000年

    ISSN: 0372-0462

  26. 東芝パソコンの音声認識/合成ソフトウェア

    正井康之, 桃崎浩平, 松浦博, 田中信一, 鈴木孝子, 赤嶺政巳, 山中紀子, 原義幸

    電子情報通信学会大会講演論文集 2000 2000年

    ISSN: 1349-1369

  27. コーパスベース音声合成 閉ループ学習に基づく音声素片辞書の生成

    赤嶺政巳, 篭嶋岳彦

    日本音響学会研究発表会講演論文集 1999 1999年

    ISSN: 1340-3168

  28. モーラを単位としたアクセント規則の自動構築

    森田真弘, 瀬戸重宣, 篭嶋岳彦, 赤嶺政巳

    日本音響学会研究発表会講演論文集 1998 1998年

    ISSN: 1340-3168

  29. DSP組み込み可能な省メモリ音声合成方式

    新居孝章, 瀬戸重宣, 赤嶺政巳

    日本音響学会研究発表会講演論文集 1998 1998年

    ISSN: 1340-3168

  30. 適応パルス位置代数符号帳を用いたCELP音声符号化

    天田皇, 三関公生, 赤嶺政巳

    日本音響学会研究発表会講演論文集 1998 1998年

    ISSN: 1340-3168

  31. ベクトル量子化に基づいた音声合成素片辞書の符号化

    土谷勝美, 篭嶋岳彦, 赤嶺政巳

    日本音響学会研究発表会講演論文集 1998 1998年

    ISSN: 1340-3168

  32. 代表パターンコードブックを用いたピッチパターン制御法

    篭嶋岳彦, 瀬戸重宣, 森田真弘, 赤嶺政巳

    日本音響学会研究発表会講演論文集 1998 1998年

    ISSN: 1340-3168

  33. スペクトルの変動に着目した有音/無音判定法と可変レート音声コーデックへの適用

    押切正浩, 赤嶺政巳

    日本音響学会研究発表会講演論文集 1997 (Spring Pt 1) 1997年

    ISSN: 1340-3168

  34. ピッチ周期の補間ベクトル量子化を用いた可変レート音声符号化

    押切正浩, 赤嶺政巳

    日本音響学会研究発表会講演論文集 1997 1997年

    ISSN: 1340-3168

  35. 閉ループ学習による音声素片の自動生成 最適な素片の解析的生成

    篭嶋岳彦, 赤嶺政巳

    日本音響学会研究発表会講演論文集 1997 1997年

    ISSN: 1340-3168

  36. 閉ループ学習による音声素片の自動生成 代表素片選択

    篭嶋岳彦, 赤嶺政巳

    日本音響学会研究発表会講演論文集 1997 1997年

    ISSN: 1340-3168

  37. ピッチパターンを用いたCELP音声符号化方式

    天田皇, 赤嶺政巳

    日本音響学会研究発表会講演論文集 1997 1997年

    ISSN: 1340-3168

  38. 高音質LPC分析残差駆動合成器

    赤嶺政巳, 篭嶋岳彦, 土谷勝美

    情報処理学会研究報告 97 (66(SLP-17)) 1997年

    ISSN: 0919-6072

  39. 東芝の音声認識・合成ソフトウエアの紹介

    松浦博, 正井康之, 原義幸, 新田恒雄, 赤嶺政巳, 瀬戸重宣, 太田治徳, 鈴木孝子, 小林賢一郎

    情報処理学会研究報告 97 (66(SLP-17)) 1997年

    ISSN: 0919-6072

  40. 高音質規則音声合成器のための有声音源生成法

    篭嶋岳彦, 赤嶺政巳

    日本音響学会研究発表会講演論文集 1996 (Spring Pt 1) 1996年

    ISSN: 1340-3168

  41. 4kbps ADP-CELP音声符号化方式の低演算量化に関する検討

    天田皇, 赤嶺政巳, 三関公生

    日本音響学会研究発表会講演論文集 1996 (Spring Pt 1) 1996年

    ISSN: 1340-3168

  42. Binary-Modulated Vector Quantizationを用いた音声符号化

    三関公生, 天田皇, 押切正浩, 赤嶺政巳

    日本音響学会研究発表会講演論文集 1995 (Autumn Pt 1) 1995年

    ISSN: 1340-3168

  43. 非直交化探索法を用いたCELP音声符号化方式

    天田皇, 三関公生, 赤嶺政巳

    日本音響学会研究発表会講演論文集 1995 (Spring Pt 1) 1995年

    ISSN: 1340-3168

  44. CELP音声符号化方式における多段符号帳の非直交化探索法

    天田皇, 赤嶺政巳, 三関公生

    電子情報通信学会技術研究報告 94 (372(SP94 53-62)) 1994年

    ISSN: 0913-5685

  45. 相補直交化による基底変換を用いた音声符号化の一検討

    三関公生, 赤嶺政巳, 天田皇, 押切正浩

    電子情報通信学会大会講演論文集 1994 (Shuki Pt 1) 1994年

    ISSN: 1349-1369

  46. 有声部/無声部に適した適応符号帳を持つCELP符号化方式

    押切正浩, 赤嶺政巳, 三関公生

    電子情報通信学会大会講演論文集 1994 (Shuki Pt 1) 1994年

    ISSN: 1349-1369

  47. 音声符号化方式における符号帳の非直交化探索法

    天田皇, 三関公生, 赤嶺政巳

    電子情報通信学会大会講演論文集 1994 (Shuki Pt 1) 1994年

    ISSN: 1349-1369

  48. 3.75kb/s ADP-CELP方式

    三関公生, 赤嶺政巳, 押切正浩

    電子情報通信学会技術研究報告 93 (156(SP93 44-48)) 1993年

    ISSN: 0913-5685

  49. PARCOR-LSPハイブリッド型LPC係数量子化法

    押切正浩, 赤嶺政巳, 三関公生

    電子情報通信学会技術研究報告 93 (156(SP93 44-48)) 1993年

    ISSN: 0913-5685

  50. 極零合成フィルタ-駆動信号間適応ビット配分低レート音声符号化方式

    三関公生, 赤嶺政巳

    電子情報通信学会全国大会講演論文集 1991 (Spring Pt 1) 1991年

  51. サブバンド符号化方式に基づくATM用可変レート音声符号化方式

    吉川英隆, 赤嶺政巳, 三関公生, 工藤憲昌

    電子情報通信学会全国大会講演論文集 1990 (Spring Pt.3) 1990年

  52. 算術符号化を用いた適応KL変換符号化方式

    菊池義浩, 塚原由利子, 赤嶺政巳

    電子情報通信学会全国大会講演論文集 1990 (Spring Pt.7) 1990年

  53. サブバンド符号化方式に基づくATM用可変レート符号化方式

    吉川英隆, 赤嶺政巳, 三関公生, 工藤憲昌

    電子情報通信学会技術研究報告 89 (385(CS89 92-99)) 1990年

    ISSN: 0913-5685

  54. ADP-CELP符号化方式のDSPによる実現の検討

    奥田裕二, 赤嶺政巳, 三関公生, 吉田博則

    電子情報通信学会全国大会講演論文集 1990 (Spring Pt.1) 1990年

  55. ADP-CELP方式におけるパラメータの符号誤り感度

    神庭進, 三関公生, 赤嶺政巳

    電子情報通信学会全国大会講演論文集 1990 (Spring Pt.1) 1990年

  56. 4.8kbps ADP-CELP 音声コーデックの開発

    佐藤恭子, 渡辺栄一, 赤嶺政巳, 三関公生

    電子情報通信学会全国大会講演論文集 1990 (Autumn Pt 3) 1990年

  57. 適応KL変換符号化方式における変換選択方法の検討

    塚原由利子, 赤嶺政巳, 大関和夫

    電子情報通信学会全国大会講演論文集 1990 (Autumn Pt 6) 1990年

  58. ARMAモデルと適応密度パルス列モデルに基づく音声符号化方式

    赤嶺政巳, 三関公生

    電子情報通信学会全国大会講演論文集 1989 (Spring Pt.1) 1989年

  59. 適応密度パルス列モデルに基づくCELP符号化方式

    赤嶺政巳, 三関公生

    電子情報通信学会全国大会講演論文集 1989 (Autumn Pt.1) 1989年

  60. 高速DCT演算器の丸め誤差の理論解析

    菊池義浩, 赤嶺政巳

    電子情報通信学会全国大会講演論文集 1989 (Autumn Pt.6) 1989年

  61. 適応ビット配分を有する適応KL変換符号化方式

    赤嶺政巳, 塚原由利子, 大関和夫

    電子情報通信学会全国大会講演論文集 1989 (Autumn Pt.6) 1989年

  62. 適応型補正フィルタを用いたマルチパルス符号化方式の品質改善

    三関公生, 赤嶺政巳

    電子情報通信学会全国大会講演論文集 1989 (Autumn Pt.1) 1989年

  63. 逆スペクトルに基づく音声のARMA分析合成系の品質評価

    赤嶺政巳, 三関公生

    電子情報通信学会技術研究報告 87 (347) 1988年

    ISSN: 0913-5685

  64. 音声のARMA分析における推定精度の向上

    赤嶺政巳, 三関公生

    電子情報通信学会全国大会講演論文集 1988 (Pt. A-1) 1988年

  65. ARMAモデルを用いた8kbps音声符号化方式の検討

    赤嶺政巳

    電子情報通信学会全国大会講演論文集 1988 (Autumn Pt. A-1) 1988年

  66. 適応型補正フィルタを用いたマルチパルス駆動信号の効率的表現

    三関公生, 赤嶺政巳

    電子情報通信学会技術研究報告 88 (214) 1988年

    ISSN: 0913-5685

  67. 適応型補正フィルタを用いたマルチパルス符号化方式

    三関公生, 赤嶺政巳

    電子情報通信学会全国大会講演論文集 1988 (Autumn Pt. A-1) 1988年

  68. 逆スペクトルと自己相関法に基づく音声のARMA分析法の検討

    赤嶺政巳

    電子情報通信学会技術研究報告 87 (306) 1987年

    ISSN: 0913-5685

︎全件表示 ︎最初の5件までを表示

産業財産権 20

  1. 対話システム、対話装置、対話方法、及びプログラム

    岩田 憲治, 藤村 浩司, 小林 優佳, 吉田 尚水, 赤嶺 政巳

    特許第7132090号

    産業財産権の種類: 特許権

  2. 対話システム、方法、及びプログラム

    吉田 尚水, 岩田 憲治, 小林 優佳, 赤嶺 政巳

    特許第7035239号

    産業財産権の種類: 特許権

  3. 対話システム、対話方法および対話プログラム

    赤嶺 政巳, 吉田 尚水

    特許第6805112号

    産業財産権の種類: 特許権

  4. 対話フロー制御装置、対話フロー制御方法およびプログラム

    下郡 祐美子, 永江 尚義, 岩田 憲治, 赤嶺 政巳

    特許第6553007号

    産業財産権の種類: 特許権

  5. 音声合成方法、装置及びプログラム

    赤嶺 政巳, ラトーレ・マルティネス・ハビエル, ワン・ビンセント・ピン・ルン, チン・カン・クホン, ゲールズ・マーク・ジョン・フランシス, ニル・キャサリン・マリー, チュン・ビュン・ハ

    特許第6246777号

    産業財産権の種類: 特許権

  6. テキスト読み上げシステム

    赤嶺 政巳, ラトーレ・マルティネス・ハビエル, ワン・ビンセント・ピン・ルン, チン・カン・クホン, ゲールズ・マーク・ジョン・フランシス, ニル・キャサリン・マリー

    特許第6092293号

    産業財産権の種類: 特許権

  7. テキスト音声合成方法及びシステム

    赤嶺 政巳, ラトーレ・マルティネス・ハビエル, ワン・ビンセント・ピン・ルン, チン・カン・クホン, ゲールズ・マーク・ジョン・フランシス, ニル・キャサリン・マリー, チュン・ビュン・ハ

    特許第5847917号

    産業財産権の種類: 特許権

  8. 音声処理システム

    赤嶺 政巳, ランジョウ・チェン, マーク・ジョン・フランクルズ・ゲールズ, キャサリン・メリー・ニル

    特許第5768093号

    産業財産権の種類: 特許権

  9. テキスト音声合成方法及びシステム

    赤嶺 政巳, ラトーレ・マルティネス・ハビエル, ワン・ビンセント・ピン・ルン, チン・カン・クホン, ゲールズ・マーク・ジョン・フランシス, ニル・キャサリン・マリー, チュン・ビュン・ハ

    特許第5659258号

    産業財産権の種類: 特許権

  10. 音声モデル生成装置、音声合成装置、音声モデル生成プログラム、音声合成プログラム、音声モデル生成方法および音声合成方法

    ラトレ ハビエル, 赤嶺 政巳

    特許第5457706号

    産業財産権の種類: 特許権

  11. 対話システム、方法、及びプログラム

    吉田 尚水, 岩田 憲治, 小林 優佳, 赤嶺 政巳

    産業財産権の種類: 特許権

  12. 対話システム、対話装置、対話方法、及びプログラム

    岩田 憲治, 藤村 浩司, 小林 優佳, 吉田 尚水, 赤嶺 政巳

    産業財産権の種類: 特許権

  13. 対話システム、対話方法および対話プログラム

    赤嶺 政巳, 吉田 尚水

    産業財産権の種類: 特許権

  14. 対話システム、方法、及びプログラム

    吉田 尚水, 岩田 憲治, 小林 優佳, 赤嶺 政巳

    産業財産権の種類: 特許権

  15. 対話フロー制御装置、対話フロー制御方法およびプログラム

    下郡 祐美子, 永江 尚義, 岩田 憲治, 赤嶺 政巳

    産業財産権の種類: 特許権

  16. 音声合成方法、装置及びプログラム

    赤嶺 政巳, ラトーレ・マルティネス・ハビエル, ワン・ビンセント・ピン・ルン, チン・カン・クホン, ゲールズ・マーク・ジョン・フランシス, ニル・キャサリン・マリー, チュン・ビュン・ハ

    産業財産権の種類: 特許権

  17. 音声処理システム

    赤嶺 政巳, ランジョウ・チェン, マーク・ジョン・フランクルズ・ゲールズ, キャサリン・メリー・ニル

    産業財産権の種類: 特許権

  18. テキスト読み上げシステム

    赤嶺 政巳, ラトーレ・マルティネス・ハビエル, ワン・ビンセント・ピン・ルン, チン・カン・クホン, ゲールズ・マーク・ジョン・フランシス, ニル・キャサリン・マリー

    産業財産権の種類: 特許権

  19. テキスト音声合成方法及びシステム

    赤嶺 政巳, ラトーレ・マルティネス・ハビエル, ワン・ビンセント・ピン・ルン, チン・カン・クホン, ゲールズ・マーク・ジョン・フランシス, ニル・キャサリン・マリー, チュン・ビュン・ハ

    産業財産権の種類: 特許権

  20. 音声処理システム

    赤嶺 政巳, ランジョウ・チェン, マーク・ジョン・フランクルズ・ゲールズ, キャサリン・メリー・ニル

    産業財産権の種類: 特許権

︎全件表示 ︎最初の5件までを表示

学術貢献活動 13

  1. 電子情報通信学会論文査読委員

    1997年4月 ~ 継続中

  2. IEEE論文査読委員

    2007年1月 ~ 2023年12月

  3. IEEE Speech and Language Technical Committeeメンバー

    2018年1月 ~ 2020年12月

  4. Asia-Pacific Signal and Information Processing Association Industrial membership Committeeメンバー

    2016年4月 ~ 2019年12月

  5. ISCA Industrial Liaison Committee委員

    2010年1月 ~ 2019年12月

  6. IEEE Spoken Language Technology Workshop (SLT), Organizing Committeeメンバー

    2018年1月 ~ 2018年12月

  7. ISCA主催国際会議 (Interspeech 2008、2010、2012、2013、2014、2015、2018)

    2008年1月 ~ 2018年12月

  8. IEEE Automatic Speech Recognition and Understanding Workshop (ASRU) 2017, Organizing Committeeメンバー

    2017年4月 ~ 2017年12月

  9. IEEE主催国際会議 (ICASSP 2012、2013、2014)セッションチェアー

    2012年1月 ~ 2014年12月

  10. IEEE Speech and Language Technical Committeeメンバー

    2012年1月 ~ 2013年12月

  11. IEEE CHiME-2013 ボードメンバー

    2013年1月 ~ 2013年6月

  12. ISCA Speech Synthesis Workshop (SSW7)プログラム委員

    2010年1月 ~ 2010年12月

  13. 電子情報通信学会論文誌特集号編集委員

    1997年1月 ~ 1997年12月

︎全件表示 ︎最初の5件までを表示