Details of the Researcher

PHOTO

Masami Akamine
Section
Tohoku University Advanced Graduate School
Job title
Professor
e-Rad No.
91034700

Research History 14

  • 2025/11 - Present
    Tohoku University Tohoku University Advanced Graduate School Professor

  • 2019/04 - 2025/10
    Tohoku University Graduate School of Engineering Specially Appointed Professor

  • 2018/04 - 2019/03
    東芝研究開発センター・メディアAIラボラトリー シニアフェロー

  • 2016/04 - 2019/03
    慶應義塾大学理工学研究科 非常勤特任教授

  • 2015/04 - 2018/03
    東芝リサーチ・コンサルティング シニアフェロー

  • 2005/04 - 2015/03
    東芝研究開発センター 技監

  • 2004/04 - 2005/03
    東芝研究開発センター・特別研究室 研究主幹

  • 2002/04 - 2004/03
    東芝研究開発センター 研究企画室グループ長

  • 2000/04 - 2002/03
    東芝研究開発センター・マルチメディアラボラトリー 室長

  • 2000/04 - 2001/03
    和歌山大学大学院システム工学研究科 非常勤講師

  • 1997/04 - 2000/03
    東芝研究開発センター・関西研究所 ラボリーダー

  • 1994/04 - 1997/03
    東芝研究開発センター・情報通信システム研究所 主任研究員

  • 1989/04 - 1994/03
    東芝研究開発センター・情報通信システム研究所 研究主務

  • 1985/04 - 1989/03
    東芝総合研究所(平成4年から研究開発センターに改名)・電子機器研究所 研究員

Show all Show first 5

Education 2

  • Tohoku University Graduate School of Engineering

    1982/04 - 1985/03

  • Tohoku University

    1980/04 - 1982/03

Professional Memberships 4

  • 電子情報通信学会名誉員

    2022/06 - Present

  • APSIPA (Asia Pacific Signal and Information Processing Association)

    2008/01 - Present

  • ISCA (International Speech Communication Association)

    2003/01 - Present

  • IEEE

    1984/01 - 2023/12

Research Interests 6

  • Machine Learning

  • Digital Signal Processing

  • Spoken Dialog

  • Speech Coding

  • Automatic Speech Recognition

  • Speech Synthesis

Research Areas 1

  • Informatics / Human interfaces and interactions / Speech Processing

Awards 10

  1. 功績賞

    2020/06 電子情報通信学会

  2. 紫綬褒章

    2013/04 内閣府

  3. 業績賞

    2012/05 電子情報通信学会

  4. 全国発明表彰内閣総理大臣発明賞

    2008/06 発明協会

  5. 連作論文賞

    2003/09 電子情報通信学会

  6. 市村産業賞功績賞

    2003/04 新技術開発財団

  7. 技術開発賞

    2002/05 日本音響学会

  8. 文部科学大臣賞研究功績者

    2001/04 文部科学省

  9. テレコムシステム技術賞

    2001/03 電気通信普及財団

  10. 篠原記念学術奨励賞

    1989/03 電子情報通信学会

Show all ︎Show 5

Papers 60

  1. Dialog State Tracking for Unseen Values Using an Extended Attention Mechanism

    Takami Yoshida, Kenji Iwata, Hiroshi Fujimura, Masami Akamine

    9TH INTERNATIONAL WORKSHOP ON SPOKEN DIALOGUE SYSTEM TECHNOLOGY 579 77-89 2019

    DOI: 10.1007/978-981-13-9443-0_7  

    ISSN: 1876-1100

    eISSN: 1876-1119

  2. OUT-OF-DOMAIN SLOT VALUE DETECTION FOR SPOKEN DIALOGUE SYSTEMS WITH CONTEXT INFORMATION

    Yuka Kobayashi, Takami Yoshida, Kenji Iwata, Hiroshi Fujimura, Masami Akamine

    2018 IEEE WORKSHOP ON SPOKEN LANGUAGE TECHNOLOGY (SLT 2018) 854-861 2018

    ISSN: 2639-5479

  3. Near and Far Field Speech-in-Noise Intelligibility Improvements Based on a Time-Frequency Energy Reallocation Approach

    Tudor-Catalin Zorila, Yannis Stylianou, Tatsuma Ishihara, Masami Akamine

    IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING 24 (10) 1808-1818 2016/10

    DOI: 10.1109/TASLP.2016.2585864  

    ISSN: 2329-9290

    eISSN: 2329-9304

  4. Statistical Bandwidth Extension for Speech Synthesis Based on Gaussian Mixture Model with Sub-Band Basis Spectrum Model

    Yamato Ohtani, Masatsune Tamura, Masahiro Morita, Masami Akamine

    IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS E99D (10) 2481-2489 2016/10

    DOI: 10.1587/transinf.2016SLP0006  

    ISSN: 1745-1361

  5. Voice Activity Detection: Merging Source and Filter-based Information

    Thomas Drugman, Yannis Stylianou, Yusuke Kida, Masami Akamine

    IEEE SIGNAL PROCESSING LETTERS 23 (2) 252-256 2016/02

    DOI: 10.1109/LSP.2015.2495219  

    ISSN: 1070-9908

    eISSN: 1558-2361

  6. Emotional transplant in statistical speech synthesis based on emotion additive model

    Yaniato Ohtani, Yu Nasu, Masahiro Morita, Masami Akamine

    16TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2015), VOLS 1-5 274-278 2015

  7. A Maximum Likelihood Approach to the Detection of Moments of Maximum Excitation and its Application to High-Quality Speech Parameterization

    Ranniery Maia, Yannis Stylianou, Masami Akamine

    16TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2015), VOLS 1-5 603-607 2015

  8. On the impact of excitation and spectral parameters for expressive statistical parametric speech synthesis

    Ranniery Maia, Masami Akamine

    COMPUTER SPEECH AND LANGUAGE 28 (5) 1209-1232 2014/09

    DOI: 10.1016/j.csl.2013.10.001  

    ISSN: 0885-2308

    eISSN: 1095-8363

  9. Building HMM-TTS Voices on Diverse Data

    Vincent Wan, Javier Latorre, Kayoko Yanagisawa, Norbert Braunschweiler, Langzhou Chen, Mark J. F. Gales, Masami Akamine

    IEEE JOURNAL OF SELECTED TOPICS IN SIGNAL PROCESSING 8 (2) 296-306 2014/04

    DOI: 10.1109/JSTSP.2013.2295058  

    ISSN: 1932-4553

    eISSN: 1941-0484

  10. Integrated Expression Prediction and Speech Synthesis From Text

    Langzhou Chen, Mark J. F. Gales, Norbert Braunschweiler, Masami Akamine, Kate Knill

    IEEE JOURNAL OF SELECTED TOPICS IN SIGNAL PROCESSING 8 (2) 323-335 2014/04

    DOI: 10.1109/JSTSP.2013.2294938  

    ISSN: 1932-4553

    eISSN: 1941-0484

  11. Complex cepstrum for statistical parametric speech synthesis

    Ranniery Maia, Masami Akamine, Mark J. F. Gales

    SPEECH COMMUNICATION 55 (5) 606-618 2013/06

    DOI: 10.1016/j.specom.2012.12.008  

    ISSN: 0167-6393

    eISSN: 1872-7182

  12. Minimum mean squared error based warped complex cepstrum analysis for statistical parametric speech synthesis

    Ranniery Maia, Mark J. F. Gales, Yannis Stylianou, Masami Akamine

    14TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2013), VOLS 1-5 2335-2339 2013

    ISSN: 2308-457X

  13. Photo-Realistic Expressive Text to Talking Head Synthesis

    Vincent Wan, Robert Anderson, Art Blokland, Norbert Braunschweiler, Langzhou Chen, BalaKrishna Kolluru, Javier Latorre, Ranniery Maia, Bjoern Stenger, Kayoko Yanagisawa, Yannis Stylianou, Masami Akamine, Mark J. F. Gales, Roberto Cipolla

    14TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2013), VOLS 1-5 2666-2668 2013

    ISSN: 2308-457X

  14. TRAINING A SUPRA-SEGMENTAL PARAMETRIC F0 MODEL WITHOUT INTERPOLATING F0

    Javier Latorre, Mark J. F. Gales, Kate Knill, Masami Akamine

    2013 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP) 6880-6884 2013

    ISSN: 1520-6149

  15. COMPLEX CEPSTRUM ANALYSIS BASED ON THE MINIMUM MEAN SQUARED ERROR

    Ranniery Maia, Masami Akamine, M. J. F. Gales

    2013 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP) 7972-7976 2013

    ISSN: 1520-6149

  16. INTEGRATED AUTOMATIC EXPRESSION PREDICTION AND SPEECH SYNTHESIS FROM TEXT

    Langzhou Chen, Mark J. F. Gales, Norbert Braunschweiler, Masami Akamine, Kate Knill

    2013 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP) 7977-7981 2013

    ISSN: 1520-6149

  17. Decision tree-based acoustic models for speech recognition

    Masami Akamine, Jitendra Ajmera

    EURASIP JOURNAL ON AUDIO SPEECH AND MUSIC PROCESSING 2012

    DOI: 10.1186/1687-4722-2012-10  

    ISSN: 1687-4722

  18. COMPLEX CEPSTRUM AS PHASE INFORMATION IN STATISTICAL PARAMETRIC SPEECH SYNTHESIS

    Ranniery Maia, Masami Akamine, M. J. F. Gales

    2012 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP) 4581-4584 2012

    ISSN: 1520-6149

  19. Exploring Rich Expressive Information from Audiobook Data Using Cluster Adaptive Training

    Langzhou Chen, Mark J. F. Gales, Vincent Wan, Javier Latorre, Masami Akamine

    13TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2012 (INTERSPEECH 2012), VOLS 1-3 958-961 2012

  20. Speech factorization for HMM-TTS based on cluster adaptive training.

    Javier Latorre, Vincent Wan, Mark J. F. Gales, Langzhou Chen, K. K. Chin, Kate Knill, Masami Akamine

    13TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2012 (INTERSPEECH 2012), VOLS 1-3 970-973 2012

  21. Combining multiple high quality corpora for improving HMM-TTS

    Vincent Wan, Javier Latorre, K. K. Chin, Langzhou Chen, Mark J. F. Gales, Heiga Zen, Kate Knill, Masami Akamine

    13TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2012 (INTERSPEECH 2012), VOLS 1-3 1134-1137 2012

  22. Histogram-based spectral equalization for HMM-based speech synthesis using mel-LSP

    Yamato Ohtani, Masatsune Tamura, Masahiro Morita, Takehiko Kagoshima, Masami Akamine

    13TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2012 (INTERSPEECH 2012), VOLS 1-3 1154-1157 2012

  23. HMM-based speech synthesis using sub-band basis spectrum model

    Yamato Ohtani, Masatsune Tamura, Masahiro Morita, Takehiko Kagoshima, Masami Akamine

    13TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2012 (INTERSPEECH 2012), VOLS 1-3 1438-1441 2012

  24. Analysis on the Importance of Short-Term Speech Parameterizations for Emotional Statistical Parametric Speech Synthesis

    Ranniery Maia, Masami Akamine

    13TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2012 (INTERSPEECH 2012), VOLS 1-3 1630-1633 2012

  25. Decision Tree-Based Acoustic Models for Speech Recognition with Improved Smoothness

    Masami Akamine, Jitendra Ajmera

    IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS E94D (11) 2250-2258 2011/11

    DOI: 10.1587/transinf.E94.D.2250  

    ISSN: 1745-1361

  26. CONTINUOUS F0 IN THE SOURCE-EXCITATION GENERATION FOR HMM-BASED TTS: DO WE NEED VOICEDIUNVOICED CLASSIFICATION?

    Javier Latorre, Mark J. F. Gales, Sabine Buchholz, Kate Knill, Masatsune Tamura, Yamato Ohtani, Masami Akamine

    2011 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING 4724-4727 2011

    ISSN: 1520-6149

  27. ONE SENTENCE VOICE ADAPTATION USING GMM-BASED FREQUENCY-WARPING AND SHIFT WITH A SUB-BAND BASIS SPECTRUM MODEL

    Masatsune Tamura, Masahiro Morita, Takehiko Kagoshima, Masami Akamine

    2011 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING 5124-5127 2011

    ISSN: 1520-6149

  28. COVARIANCE CLUSTERING ON RIEMANNIAN MANIFOLDS FOR ACOUSTIC MODEL COMPRESSION

    Yusuke Shinohara, Takashi Masuko, Masami Akamine

    2010 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING 4326-4329 2010

    DOI: 10.1109/ICASSP.2010.5495661  

    ISSN: 1520-6149

  29. UNIT SELECTION SPEECH SYNTHESIS USING MULTIPLE SPEECH UNITS AT NON-ADJACENT SEGMENTS FOR PROSODY AND WAVEFORM GENERATION

    Masatsune Tamura, Norbert Braunschweiler, Takehiko Kagoshima, Masami Akamine

    2010 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING 4802-4805 2010

    DOI: 10.1109/ICASSP.2010.5495151  

    ISSN: 1520-6149

  30. Sub-band Basis Spectrum Model for Pitch-synchronous Log-spectrum and Phase Based on Approximation of Sparse Coding

    Masatsune Tamura, Takehiko Kagoshima, Masami Akamine

    11TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2010 (INTERSPEECH 2010), VOLS 3 AND 4 2406-2409 2010

  31. BAYESIAN FEATURE ENHANCEMENT USING A MIXTURE OF UNSCENTED TRANSFORMATIONS FOR UNCERTAINTY DECODING OF NOISY SPEECH

    Yusuke Shinohara, Masami Akamine

    2009 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOLS 1- 8, PROCEEDINGS 4569-4572 2009

    DOI: 10.1109/ICASSP.2009.4960647  

    ISSN: 1520-6149

  32. Decision Tree Acoustic Models for ASR

    Jitendra Ajmera, Masami Akamine

    INTERSPEECH 2009: 10TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2009, VOLS 1-5 1379-1382 2009

  33. Feedback Loop for Prosody Prediction in Concatenative Speech Synthesis.

    Javier Latorre, Sergio Gracia, Masami Akamine

    INTERSPEECH 2009: 10TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2009, VOLS 1-5 2027-2030 2009

  34. Speech Recognition using Soft Decision Trees

    Jitendra Ajmera, Masami Akamine

    INTERSPEECH 2008: 9TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2008, VOLS 1-5 940-943 2008

  35. Comparative Evaluation of Different Methods for Voice Activity Detection

    Hongfei Ding, Koichi Yamamoto, Masami Akamine

    INTERSPEECH 2008: 9TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2008, VOLS 1-5 107-110 2008

  36. Multilevel parametric-base F0 model for speech synthesis

    Javier Latorre, Masami Akamine

    INTERSPEECH 2008: 9TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2008, VOLS 1-5 2274-2277 2008

  37. Feature enhancement by speaker-normalized splice for robust speech recognition

    Yusuke Shinohara, Takashi Masuko, Masami Akamine

    2008 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING, VOLS 1-12 4881-4884 2008

    ISSN: 1520-6149

  38. HMM-based Speech Recognition Using Decision Trees Instead of GMMs

    Remco Teunen, Masami Akamine

    INTERSPEECH 2007: 8TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION, VOLS 1-4 617-620 2007

  39. Automatic Generation of Optimal Synthesis Units Based on Closed Loop Training.

    篭嶋岳彦, 赤嶺政巳

    電子情報通信学会論文誌 D-2 J83-D-2 (6) 2000

    ISSN: 0915-1923

  40. Toshiba English Text-to-Speech System (TESS) Peer-reviewed

    C. K. Suh, T. Kagoshima, M. Morita, S. Seto, M. Akamine

    Proc. Eurospeech99 2111-2114 1999

  41. CELP speech coding based on an adaptive pulse position codebook Peer-reviewed

    T. Amada, K. Miseki, M. Akamine

    IEEE Proc. ICASSP99 13-16 1999

  42. Analytic Generation of Synthesis Units by Closed Loop Training for Totally Speaker Driven Text to Speech System (TOS Drive TTS) Peer-reviewed

    M. Akamine, T. Kagoshima

    1927-1930 1998

  43. An F0 Contour Control Model for Totally Speaker Driven Text to Speech System Peer-reviewed

    T. Kagoshima, M. Morita, S. Seto, M. Akamine

    IEEE Proc. ICSLP98 1975-1978 1998

  44. Automatic Rule Generation for Linguistic Features Analysis Using Inductive Learning Technique-Linguistic Features Analysis in TOS Drive TTS System Peer-reviewed

    S. Seto, M. Morita, T. Kagoshima, M. Akamine

    IEEE Proc. ICSLP98 2031-2034 1998

  45. A 2.4 Kbps Variable Bit Rate ADP-CELP Speech Coder Peer-reviewed

    M. Oshikiri, M. Akamine

    IEEE Proc. ICASSP 1 517-520 1998

  46. Automatic Generation of Synthesis Units by Selection Based on Closed Loop Training.

    篭嶋岳彦, 赤嶺政巳

    電子情報通信学会論文誌 D-2 J81-D-2 (9) 1998

    ISSN: 0915-1923

  47. A 2.4kbps Variable Bit Rate ADP-CELP Speech Coder.

    押切正浩, 赤嶺政巳

    電子情報通信学会論文誌 A J81-A (11) 1998

    ISSN: 0913-5707

  48. Automatic Generation of Speech Synthesis Units Based on Closed Loop Training Peer-reviewed

    T. Kagoshima, M. Akamine

    IEEE Proc. ICASSP97 2 963-966 1997

  49. Fast Excitation Codebook Search Based on the Orthogonalized Target Vector for CELP Speech Coding.

    天田皇, 赤嶺政巳, 三関公生

    電子情報通信学会論文誌 A 79 (5) 1996

    ISSN: 0913-5707

  50. Adaptive Density Pulse Excitation for Low Bit Rate Speech Coding Peer-reviewed

    Masami Akamine, Kimio Miseki

    IEICE Trans. E78 (2) 199-207 1995/02

  51. Improvement of ADP-CELP Speech Coding at 4 Kbits/s Peer-reviewed

    M. Akamine, K. Miseki, M. Oshikiri

    IEEE Proc. GLOBECOM 1869-1873 1991

  52. Efficient Excitation Model for Low Bit Rate Speech Coding

    M. Akamine, K. Miseki

    IEEE Proc. ISCAS 586-589 1991

  53. Adaptive Bit-Allocation between the Pole-Zero Synthesis Filter and Excitation in CELP Peer-reviewed

    K. Miseki, M. Akamine

    229-232 1991

  54. Error Free Calculation Precision of DCT in Image Coding.

    菊池義池, 赤嶺政巳

    電子情報通信学会論文誌 A 74 (7) 1991

    ISSN: 0913-5707

  55. CELP Coding with an Adaptive Density Pulse Excitation Model

    M. Akamine, K. Miseki

    IEEE Proc. ICASSP 29-32 1990

  56. ARMA Model Based Speech Coding at 8 kb/s Peer-reviewed

    M. Akamine, K. Miseki

    IEEE Proc. ICASSP 148-151 1989

  57. A class of limit cycle free floating-point digital filters with minimum roundoff noise.

    赤嶺政巳, 樋口龍雄

    電子情報通信学会論文誌 A 70 (5) 1987

    ISSN: 0913-5707

  58. State-Space Approach to Synthesis of Minimum Quantization Error Digital Filter Using Floating-Point Arithmetic Peer-reviewed

    M. Akamine, T. Higuchi

    IEEE Proc. ISCAS 3 1002-1005 1984/03

  59. 浮動小数点演算を用いた量子化誤差最小ディジタルフィルタの合成 Peer-reviewed

    赤嶺政巳, 樋口龍雄

    電子情報通信学会論文誌 A 66 (10) 895-902 1983/10

  60. 浮動小数点演算を用いたディジタルフィルタの状態方程式に基づく量子化誤差解析 Peer-reviewed

    樋口龍雄, 赤嶺政巳

    電子情報通信学会論文誌 A 66 (3) 186-193 1983/03

Show all ︎Show first 5

Misc. 68

  1. Dereverberation Method to Improve Accuracy of Recognition of Spoken Language Collected by Distant Microphone

    籠嶋岳彦, KIM Uihyun, 赤嶺政巳

    東芝レビュー(Web) 73 (5) 2018

    ISSN: 2432-1168

  2. 平静音声から予測した感情付与モデルに基づく統計的感情音声合成

    大谷大和, 那須悠, 森田眞弘, 赤嶺政巳

    日本音響学会研究発表会講演論文集(CD-ROM) 2015 2015

    ISSN: 1880-7658

  3. Statistical bandwidth extension using sub-band basis spectrum model

    大谷大和, 田村正統, 森田眞弘, 赤嶺政巳

    電子情報通信学会技術研究報告 114 (52(SP2014 1-45)) 2014

    ISSN: 0913-5685

  4. 表情豊かな音声と顔画像を合成するシステムXpressiveTalkの開発

    森中亮, 那須悠, 田村正統, WAN Vincenty, 柳澤佳代子, STENGER Bjorn, 森田眞弘, 籠嶋岳彦, 赤嶺政巳

    日本音響学会研究発表会講演論文集(CD-ROM) 2014 2014

    ISSN: 1880-7658

  5. サブバンド基底スペクトルモデルを用いたGMMに基づく帯域拡張

    大谷大和, 田村正統, 森田眞弘, 赤嶺政巳

    日本音響学会研究発表会講演論文集(CD-ROM) 2014 2014

    ISSN: 1880-7658

  6. HMM音声合成における加算モデルに基づく任意話者への感情付与法の検討

    大谷大和, 那須悠, 森中亮, 田村正統, 森田眞弘, 赤嶺政巳

    日本音響学会研究発表会講演論文集(CD-ROM) 2014 2014

    ISSN: 1880-7658

  7. Shared emotion additive model for HMM-based emotional speech synthesis

    大谷大和, 那須悠, 森中亮, 田村正統, 森田眞弘, 赤嶺政巳

    電子情報通信学会技術研究報告 114 (303(SP2014 90-105)) 2014

    ISSN: 0913-5685

  8. サブバンド基底スペクトルモデルを用いたHMM音声合成

    大谷大和, 田村正統, 森田眞弘, 籠嶋岳彦, 赤嶺政巳

    日本音響学会研究発表会講演論文集(CD-ROM) 2013 2013

    ISSN: 1880-7658

  9. Speech Processing Technologies Becoming Common in Daily Life, and Toshiba’s Approach

    赤嶺政巳

    東芝レビュー 68 (9) 2013

    ISSN: 0372-0462

  10. Text to Speech Technologies in Toshiba-Closed-loop Training to Recent Development-

    赤嶺政巳

    電子情報通信学会技術研究報告 113 (366(SP2013 82-95)) 2013

    ISSN: 0913-5685

  11. HMM音声合成による英語音声合成システムの開発

    田村正統, KRSTULOVIC Sacha, 森中亮, 徳田龍太郎, 全炳河, 森田眞弘, 籠嶋岳彦, 赤嶺政巳

    日本音響学会研究発表会講演論文集(CD-ROM) 2011 2011

    ISSN: 1880-7658

  12. リーマン幾何学に基づく共分散クラスタリングによる音響モデルの圧縮

    篠原雄介, 益子貴史, 赤嶺政巳

    日本音響学会研究発表会講演論文集(CD-ROM) 2010 2010

    ISSN: 1880-7658

  13. 耐雑音音声認識のためのアンセンテッド変換を用いた特徴強調法

    篠原雄介, 赤嶺政巳

    日本音響学会研究発表会講演論文集(CD-ROM) 2009 2009

    ISSN: 1880-7658

  14. Voice Activity Detection Technology with Robust Performance in Noisy Environments

    山本幸一, 赤嶺政巳

    東芝レビュー 64 (12) 2009

    ISSN: 0372-0462

  15. Generation of Speech Synthesis Units And F0 Control Rules Based on Closed-Loop Training

    篭智岳彦, 赤嶺政巳, 瀬戸重宣, 森田真弘, 志賀芳則

    電子情報通信学会技術研究報告 103 (632(SP2003 170-174)) 2004

    ISSN: 0913-5685

  16. FWFモデルを用いたピッチ波形の閉ループ学習

    篭嶋岳彦, 赤嶺政巳

    日本音響学会研究発表会講演論文集 2003 2003

    ISSN: 1340-3168

  17. スペクトル包絡を制御するためのピッチ波形のモデリング

    篭嶋岳彦, 赤嶺政巳

    日本音響学会研究発表会講演論文集 2003 2003

    ISSN: 1340-3168

  18. コンパクトなテキスト音声合成システムの開発

    清水勇詞, 瀬戸重宣, 篭嶋岳彦, 赤嶺政巳

    日本音響学会研究発表会講演論文集 2002 2002

    ISSN: 1340-3168

  19. TOS-Drive TTSの米・英・独・仏・中国語への応用

    平林剛, 森田真弘, 徳田龍太郎, 篭嶋岳彦, 赤嶺政巳

    日本音響学会研究発表会講演論文集 2002 2002

    ISSN: 1340-3168

  20. 合成辞書作成に用いる音声DBの品質が合成音声に与える影響について

    瀬戸重宣, 篭嶋岳彦, 土谷勝美, 赤嶺政巳

    日本音響学会研究発表会講演論文集 2002 2002

    ISSN: 1340-3168

  21. サブバンド閉ループ学習による音声素片の生成

    篭嶋岳彦, 赤嶺政巳

    日本音響学会研究発表会講演論文集 2002 2002

    ISSN: 1340-3168

  22. 音素HMMを環境適応的に選択して用いた競合モデルによる環境雑音のリジェクション

    小柴亮典, 酒井優, 天田皇, 河村聡典, 正井康之, 赤嶺政巳

    日本音響学会研究発表会講演論文集 2002 2002

    ISSN: 1340-3168

  23. An F0 Contour Control Model Using an F0 Contour Codebook.

    篭嶋岳彦, 森田真弘, 瀬戸重宣, 赤嶺政巳, 志賀芳則

    電子情報通信学会論文誌 D-2 J85-D-2 (6) 2002

    ISSN: 0915-1923

  24. 多言語音声認識エンジンの開発

    出口豊, 金沢博史, 赤嶺政巳

    日本音響学会研究発表会講演論文集 2002 2002

    ISSN: 1340-3168

  25. ITS (Intelligent Transport Systems). Onboard Multimedia.

    前田賢一, 赤嶺政巳, 加瀬直樹

    東芝レビュー 55 (1) 2000

    ISSN: 0372-0462

  26. 東芝パソコンの音声認識/合成ソフトウェア

    正井康之, 桃崎浩平, 松浦博, 田中信一, 鈴木孝子, 赤嶺政巳, 山中紀子, 原義幸

    電子情報通信学会大会講演論文集 2000 2000

    ISSN: 1349-1369

  27. Generation of phonemic unit corpus based on closed-loop traininng.

    赤嶺政巳, 篭嶋岳彦

    日本音響学会研究発表会講演論文集 1999 1999

    ISSN: 1340-3168

  28. Generating Accentuation Rules using Mora-by-Mora Accent Estimation.

    森田真弘, 瀬戸重宣, 篭嶋岳彦, 赤嶺政巳

    日本音響学会研究発表会講演論文集 1998 1998

    ISSN: 1340-3168

  29. Digital Signal Processor. A Method of memory saved speech synthesis for DSP.

    新居孝章, 瀬戸重宣, 赤嶺政巳

    日本音響学会研究発表会講演論文集 1998 1998

    ISSN: 1340-3168

  30. CELP speech coding using adaptive pulse position algebraic codebook.

    天田皇, 三関公生, 赤嶺政巳

    日本音響学会研究発表会講演論文集 1998 1998

    ISSN: 1340-3168

  31. Speech synthesis units coding based on vector quantization.

    土谷勝美, 篭嶋岳彦, 赤嶺政巳

    日本音響学会研究発表会講演論文集 1998 1998

    ISSN: 1340-3168

  32. An F0 contour control model using an F0 contour codebook.

    篭嶋岳彦, 瀬戸重宣, 森田真弘, 赤嶺政巳

    日本音響学会研究発表会講演論文集 1998 1998

    ISSN: 1340-3168

  33. A Speech/Silence Segmentation Method using Spectral Variation and the Application to a Variable Rate Speech Codec.

    押切正浩, 赤嶺政巳

    日本音響学会研究発表会講演論文集 1997 (Spring Pt 1) 1997

    ISSN: 1340-3168

  34. A Variable Bit Rate Speech Codec using Interframe Pitch Interpolation and Intraframe Pitch-vector Quantization.

    押切正浩, 赤嶺政巳

    日本音響学会研究発表会講演論文集 1997 1997

    ISSN: 1340-3168

  35. Automatic Generation of Speech Synthesis Units Based on Closed Loop Training. Generation of Optimal Synthesis units.

    篭嶋岳彦, 赤嶺政巳

    日本音響学会研究発表会講演論文集 1997 1997

    ISSN: 1340-3168

  36. Automatic Generation of Speech Synthesis Units Based on Closed Loop Training. Selection of Representative Units.

    篭嶋岳彦, 赤嶺政巳

    日本音響学会研究発表会講演論文集 1997 1997

    ISSN: 1340-3168

  37. CELP coding using pitch pattern.

    天田皇, 赤嶺政巳

    日本音響学会研究発表会講演論文集 1997 1997

    ISSN: 1340-3168

  38. Residue Excited LPC Synthesizer with High Quality Speech.

    赤嶺政巳, 篭嶋岳彦, 土谷勝美

    情報処理学会研究報告 97 (66(SLP-17)) 1997

    ISSN: 0919-6072

  39. Introduction of speech recognition and synthesis software of TOSHIBA Co.,Ltd.

    松浦博, 正井康之, 原義幸, 新田恒雄, 赤嶺政巳, 瀬戸重宣, 太田治徳, 鈴木孝子, 小林賢一郎

    情報処理学会研究報告 97 (66(SLP-17)) 1997

    ISSN: 0919-6072

  40. A Study on Voice Source Generation for Text-to-Speech Synthesis.

    篭嶋岳彦, 赤嶺政巳

    日本音響学会研究発表会講演論文集 1996 (Spring Pt 1) 1996

    ISSN: 1340-3168

  41. A study of reduction of complexity for 4kbps ADP-CELP speech coding.

    天田皇, 赤嶺政巳, 三関公生

    日本音響学会研究発表会講演論文集 1996 (Spring Pt 1) 1996

    ISSN: 1340-3168

  42. Speech Coding Using Binary-Modulated Vector Quantization.

    三関公生, 天田皇, 押切正浩, 赤嶺政巳

    日本音響学会研究発表会講演論文集 1995 (Autumn Pt 1) 1995

    ISSN: 1340-3168

  43. CELP speech coding using non-orthogonal codebook search.

    天田皇, 三関公生, 赤嶺政巳

    日本音響学会研究発表会講演論文集 1995 (Spring Pt 1) 1995

    ISSN: 1340-3168

  44. Non-orthogonal Codebook Search for Multiple-stage CELP Coders.

    天田皇, 赤嶺政巳, 三関公生

    電子情報通信学会技術研究報告 94 (372(SP94 53-62)) 1994

    ISSN: 0913-5685

  45. A study on speech coding using co-orthogonal basis transform.

    三関公生, 赤嶺政巳, 天田皇, 押切正浩

    電子情報通信学会大会講演論文集 1994 (Shuki Pt 1) 1994

    ISSN: 1349-1369

  46. CELP Coding with Individual Adaptive Codebooks for Voiced and Unvoiced Frame.

    押切正浩, 赤嶺政巳, 三関公生

    電子情報通信学会大会講演論文集 1994 (Shuki Pt 1) 1994

    ISSN: 1349-1369

  47. Non-orthogonal Codebook Search for CELP.

    天田皇, 三関公生, 赤嶺政巳

    電子情報通信学会大会講演論文集 1994 (Shuki Pt 1) 1994

    ISSN: 1349-1369

  48. 3.75kb/s ADP-CELP speech coder.

    三関公生, 赤嶺政巳, 押切正浩

    電子情報通信学会技術研究報告 93 (156(SP93 44-48)) 1993

    ISSN: 0913-5685

  49. LPC Coefficients Quantization Method using Hybrid PARCOR-LSP Vector Quantization.

    押切正浩, 赤嶺政巳, 三関公生

    電子情報通信学会技術研究報告 93 (156(SP93 44-48)) 1993

    ISSN: 0913-5685

  50. Speech coding using an adaptive bit allocation between the pole-zero synthesis filter and excitation.

    三関公生, 赤嶺政巳

    電子情報通信学会全国大会講演論文集 1991 (Spring Pt 1) 1991

  51. Variable rate speech coding for ATM networks based on sub-band coding.

    吉川英隆, 赤嶺政巳, 三関公生, 工藤憲昌

    電子情報通信学会全国大会講演論文集 1990 (Spring Pt.3) 1990

  52. An adaptive kl transform coding with arithmetic coding.

    菊池義浩, 塚原由利子, 赤嶺政巳

    電子情報通信学会全国大会講演論文集 1990 (Spring Pt.7) 1990

  53. Variable rate coding for ATM networks based on sub-band coding.

    吉川英隆, 赤嶺政巳, 三関公生, 工藤憲昌

    電子情報通信学会技術研究報告 89 (385(CS89 92-99)) 1990

    ISSN: 0913-5685

  54. A study on a implementation of ADP-CELP coding using DSP.

    奥田裕二, 赤嶺政巳, 三関公生, 吉田博則

    電子情報通信学会全国大会講演論文集 1990 (Spring Pt.1) 1990

  55. Error sensitivity of parameters encoded by adp-celp coding.

    神庭進, 三関公生, 赤嶺政巳

    電子情報通信学会全国大会講演論文集 1990 (Spring Pt.1) 1990

  56. Development of 4.8kbps ADP-CELP voice codec.

    佐藤恭子, 渡辺栄一, 赤嶺政巳, 三関公生

    電子情報通信学会全国大会講演論文集 1990 (Autumn Pt 3) 1990

  57. Selection of transforms for adaptive KL transform coding with variable length code.

    塚原由利子, 赤嶺政巳, 大関和夫

    電子情報通信学会全国大会講演論文集 1990 (Autumn Pt 6) 1990

  58. A speech coding based on ARMA model and adaptive density pulse model.

    赤嶺政巳, 三関公生

    電子情報通信学会全国大会講演論文集 1989 (Spring Pt.1) 1989

  59. A CELP coding based on adaptive density pulse model.

    赤嶺政巳, 三関公生

    電子情報通信学会全国大会講演論文集 1989 (Autumn Pt.1) 1989

  60. Analysis of roundoff error in the fast DCT algorithm.

    菊池義浩, 赤嶺政巳

    電子情報通信学会全国大会講演論文集 1989 (Autumn Pt.6) 1989

  61. An adaptive KL transform coding with adaptive bit allocation.

    赤嶺政巳, 塚原由利子, 大関和夫

    電子情報通信学会全国大会講演論文集 1989 (Autumn Pt.6) 1989

  62. Improved multi-pulse speech coding using An adaptive compensation filter.

    三関公生, 赤嶺政巳

    電子情報通信学会全国大会講演論文集 1989 (Autumn Pt.1) 1989

  63. Speech quality of an ARMA analysis-synthesis system based on inverse spectrum.

    赤嶺政巳, 三関公生

    電子情報通信学会技術研究報告 87 (347) 1988

    ISSN: 0913-5685

  64. An improvement on ARMA speech analysis.

    赤嶺政巳, 三関公生

    電子情報通信学会全国大会講演論文集 1988 (Pt. A-1) 1988

  65. A study on 8kbps speech coding using ARMA model.

    赤嶺政巳

    電子情報通信学会全国大会講演論文集 1988 (Autumn Pt. A-1) 1988

  66. An efficient expression for multi-pulse excition using an adaptive compensation filter.

    三関公生, 赤嶺政巳

    電子情報通信学会技術研究報告 88 (214) 1988

    ISSN: 0913-5685

  67. Multi-pulse speech coding using an adaptive compensation filter.

    三関公生, 赤嶺政巳

    電子情報通信学会全国大会講演論文集 1988 (Autumn Pt. A-1) 1988

  68. ARMA analysis of speech based on inverse spectrum and autocorrelation method.

    赤嶺政巳

    電子情報通信学会技術研究報告 87 (306) 1987

    ISSN: 0913-5685

Show all ︎Show first 5

Industrial Property Rights 20

  1. 対話システム、対話装置、対話方法、及びプログラム

    岩田 憲治, 藤村 浩司, 小林 優佳, 吉田 尚水, 赤嶺 政巳

    特許第7132090号

    Property Type: Patent

  2. 対話システム、方法、及びプログラム

    吉田 尚水, 岩田 憲治, 小林 優佳, 赤嶺 政巳

    特許第7035239号

    Property Type: Patent

  3. 対話システム、対話方法および対話プログラム

    赤嶺 政巳, 吉田 尚水

    特許第6805112号

    Property Type: Patent

  4. 対話フロー制御装置、対話フロー制御方法およびプログラム

    下郡 祐美子, 永江 尚義, 岩田 憲治, 赤嶺 政巳

    特許第6553007号

    Property Type: Patent

  5. 音声合成方法、装置及びプログラム

    赤嶺 政巳, ラトーレ・マルティネス・ハビエル, ワン・ビンセント・ピン・ルン, チン・カン・クホン, ゲールズ・マーク・ジョン・フランシス, ニル・キャサリン・マリー, チュン・ビュン・ハ

    特許第6246777号

    Property Type: Patent

  6. テキスト読み上げシステム

    赤嶺 政巳, ラトーレ・マルティネス・ハビエル, ワン・ビンセント・ピン・ルン, チン・カン・クホン, ゲールズ・マーク・ジョン・フランシス, ニル・キャサリン・マリー

    特許第6092293号

    Property Type: Patent

  7. テキスト音声合成方法及びシステム

    赤嶺 政巳, ラトーレ・マルティネス・ハビエル, ワン・ビンセント・ピン・ルン, チン・カン・クホン, ゲールズ・マーク・ジョン・フランシス, ニル・キャサリン・マリー, チュン・ビュン・ハ

    特許第5847917号

    Property Type: Patent

  8. 音声処理システム

    赤嶺 政巳, ランジョウ・チェン, マーク・ジョン・フランクルズ・ゲールズ, キャサリン・メリー・ニル

    特許第5768093号

    Property Type: Patent

  9. テキスト音声合成方法及びシステム

    赤嶺 政巳, ラトーレ・マルティネス・ハビエル, ワン・ビンセント・ピン・ルン, チン・カン・クホン, ゲールズ・マーク・ジョン・フランシス, ニル・キャサリン・マリー, チュン・ビュン・ハ

    特許第5659258号

    Property Type: Patent

  10. 音声モデル生成装置、音声合成装置、音声モデル生成プログラム、音声合成プログラム、音声モデル生成方法および音声合成方法

    ラトレ ハビエル, 赤嶺 政巳

    特許第5457706号

    Property Type: Patent

  11. 対話システム、方法、及びプログラム

    吉田 尚水, 岩田 憲治, 小林 優佳, 赤嶺 政巳

    Property Type: Patent

  12. 対話システム、対話装置、対話方法、及びプログラム

    岩田 憲治, 藤村 浩司, 小林 優佳, 吉田 尚水, 赤嶺 政巳

    Property Type: Patent

  13. 対話システム、対話方法および対話プログラム

    赤嶺 政巳, 吉田 尚水

    Property Type: Patent

  14. 対話システム、方法、及びプログラム

    吉田 尚水, 岩田 憲治, 小林 優佳, 赤嶺 政巳

    Property Type: Patent

  15. 対話フロー制御装置、対話フロー制御方法およびプログラム

    下郡 祐美子, 永江 尚義, 岩田 憲治, 赤嶺 政巳

    Property Type: Patent

  16. 音声合成方法、装置及びプログラム

    赤嶺 政巳, ラトーレ・マルティネス・ハビエル, ワン・ビンセント・ピン・ルン, チン・カン・クホン, ゲールズ・マーク・ジョン・フランシス, ニル・キャサリン・マリー, チュン・ビュン・ハ

    Property Type: Patent

  17. 音声処理システム

    赤嶺 政巳, ランジョウ・チェン, マーク・ジョン・フランクルズ・ゲールズ, キャサリン・メリー・ニル

    Property Type: Patent

  18. テキスト読み上げシステム

    赤嶺 政巳, ラトーレ・マルティネス・ハビエル, ワン・ビンセント・ピン・ルン, チン・カン・クホン, ゲールズ・マーク・ジョン・フランシス, ニル・キャサリン・マリー

    Property Type: Patent

  19. テキスト音声合成方法及びシステム

    赤嶺 政巳, ラトーレ・マルティネス・ハビエル, ワン・ビンセント・ピン・ルン, チン・カン・クホン, ゲールズ・マーク・ジョン・フランシス, ニル・キャサリン・マリー, チュン・ビュン・ハ

    Property Type: Patent

  20. 音声処理システム

    赤嶺 政巳, ランジョウ・チェン, マーク・ジョン・フランクルズ・ゲールズ, キャサリン・メリー・ニル

    Property Type: Patent

Show all Show first 5

Academic Activities 13

  1. 電子情報通信学会論文査読委員

    1997/04 - Present

  2. IEEE論文査読委員

    2007/01 - 2023/12

  3. IEEE Speech and Language Technical Committeeメンバー

    2018/01 - 2020/12

  4. Asia-Pacific Signal and Information Processing Association Industrial membership Committeeメンバー

    2016/04 - 2019/12

  5. ISCA Industrial Liaison Committee委員

    2010/01 - 2019/12

  6. IEEE Spoken Language Technology Workshop (SLT), Organizing Committeeメンバー

    2018/01 - 2018/12

  7. ISCA主催国際会議 (Interspeech 2008、2010、2012、2013、2014、2015、2018)

    2008/01 - 2018/12

  8. IEEE Automatic Speech Recognition and Understanding Workshop (ASRU) 2017, Organizing Committeeメンバー

    2017/04 - 2017/12

  9. IEEE主催国際会議 (ICASSP 2012、2013、2014)セッションチェアー

    2012/01 - 2014/12

  10. IEEE Speech and Language Technical Committeeメンバー

    2012/01 - 2013/12

  11. IEEE CHiME-2013 ボードメンバー

    2013/01 - 2013/06

  12. ISCA Speech Synthesis Workshop (SSW7)プログラム委員

    2010/01 - 2010/12

  13. 電子情報通信学会論文誌特集号編集委員

    1997/01 - 1997/12

Show all Show first 5