Details of the Researcher
Research History 14
-
2025/11 - PresentTohoku University Tohoku University Advanced Graduate School Professor
-
2019/04 - 2025/10Tohoku University Graduate School of Engineering Specially Appointed Professor
-
2018/04 - 2019/03東芝研究開発センター・メディアAIラボラトリー シニアフェロー
-
2016/04 - 2019/03慶應義塾大学理工学研究科 非常勤特任教授
-
2015/04 - 2018/03東芝リサーチ・コンサルティング シニアフェロー
-
2005/04 - 2015/03東芝研究開発センター 技監
-
2004/04 - 2005/03東芝研究開発センター・特別研究室 研究主幹
-
2002/04 - 2004/03東芝研究開発センター 研究企画室グループ長
-
2000/04 - 2002/03東芝研究開発センター・マルチメディアラボラトリー 室長
-
2000/04 - 2001/03和歌山大学大学院システム工学研究科 非常勤講師
-
1997/04 - 2000/03東芝研究開発センター・関西研究所 ラボリーダー
-
1994/04 - 1997/03東芝研究開発センター・情報通信システム研究所 主任研究員
-
1989/04 - 1994/03東芝研究開発センター・情報通信システム研究所 研究主務
-
1985/04 - 1989/03東芝総合研究所(平成4年から研究開発センターに改名)・電子機器研究所 研究員
Education 2
-
Tohoku University Graduate School of Engineering
1982/04 - 1985/03
-
Tohoku University
1980/04 - 1982/03
Professional Memberships 4
-
電子情報通信学会名誉員
2022/06 - Present
-
APSIPA (Asia Pacific Signal and Information Processing Association)
2008/01 - Present
-
ISCA (International Speech Communication Association)
2003/01 - Present
-
IEEE
1984/01 - 2023/12
Research Interests 6
-
Machine Learning
-
Digital Signal Processing
-
Spoken Dialog
-
Speech Coding
-
Automatic Speech Recognition
-
Speech Synthesis
Research Areas 1
-
Informatics / Human interfaces and interactions / Speech Processing
Papers 60
-
Dialog State Tracking for Unseen Values Using an Extended Attention Mechanism
Takami Yoshida, Kenji Iwata, Hiroshi Fujimura, Masami Akamine
9TH INTERNATIONAL WORKSHOP ON SPOKEN DIALOGUE SYSTEM TECHNOLOGY 579 77-89 2019
DOI: 10.1007/978-981-13-9443-0_7
ISSN: 1876-1100
eISSN: 1876-1119
-
OUT-OF-DOMAIN SLOT VALUE DETECTION FOR SPOKEN DIALOGUE SYSTEMS WITH CONTEXT INFORMATION
Yuka Kobayashi, Takami Yoshida, Kenji Iwata, Hiroshi Fujimura, Masami Akamine
2018 IEEE WORKSHOP ON SPOKEN LANGUAGE TECHNOLOGY (SLT 2018) 854-861 2018
ISSN: 2639-5479
-
Near and Far Field Speech-in-Noise Intelligibility Improvements Based on a Time-Frequency Energy Reallocation Approach
Tudor-Catalin Zorila, Yannis Stylianou, Tatsuma Ishihara, Masami Akamine
IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING 24 (10) 1808-1818 2016/10
DOI: 10.1109/TASLP.2016.2585864
ISSN: 2329-9290
eISSN: 2329-9304
-
Statistical Bandwidth Extension for Speech Synthesis Based on Gaussian Mixture Model with Sub-Band Basis Spectrum Model
Yamato Ohtani, Masatsune Tamura, Masahiro Morita, Masami Akamine
IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS E99D (10) 2481-2489 2016/10
DOI: 10.1587/transinf.2016SLP0006
ISSN: 1745-1361
-
Voice Activity Detection: Merging Source and Filter-based Information
Thomas Drugman, Yannis Stylianou, Yusuke Kida, Masami Akamine
IEEE SIGNAL PROCESSING LETTERS 23 (2) 252-256 2016/02
ISSN: 1070-9908
eISSN: 1558-2361
-
Emotional transplant in statistical speech synthesis based on emotion additive model
Yaniato Ohtani, Yu Nasu, Masahiro Morita, Masami Akamine
16TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2015), VOLS 1-5 274-278 2015
-
A Maximum Likelihood Approach to the Detection of Moments of Maximum Excitation and its Application to High-Quality Speech Parameterization
Ranniery Maia, Yannis Stylianou, Masami Akamine
16TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2015), VOLS 1-5 603-607 2015
-
On the impact of excitation and spectral parameters for expressive statistical parametric speech synthesis
Ranniery Maia, Masami Akamine
COMPUTER SPEECH AND LANGUAGE 28 (5) 1209-1232 2014/09
DOI: 10.1016/j.csl.2013.10.001
ISSN: 0885-2308
eISSN: 1095-8363
-
Building HMM-TTS Voices on Diverse Data
Vincent Wan, Javier Latorre, Kayoko Yanagisawa, Norbert Braunschweiler, Langzhou Chen, Mark J. F. Gales, Masami Akamine
IEEE JOURNAL OF SELECTED TOPICS IN SIGNAL PROCESSING 8 (2) 296-306 2014/04
DOI: 10.1109/JSTSP.2013.2295058
ISSN: 1932-4553
eISSN: 1941-0484
-
Integrated Expression Prediction and Speech Synthesis From Text
Langzhou Chen, Mark J. F. Gales, Norbert Braunschweiler, Masami Akamine, Kate Knill
IEEE JOURNAL OF SELECTED TOPICS IN SIGNAL PROCESSING 8 (2) 323-335 2014/04
DOI: 10.1109/JSTSP.2013.2294938
ISSN: 1932-4553
eISSN: 1941-0484
-
Complex cepstrum for statistical parametric speech synthesis
Ranniery Maia, Masami Akamine, Mark J. F. Gales
SPEECH COMMUNICATION 55 (5) 606-618 2013/06
DOI: 10.1016/j.specom.2012.12.008
ISSN: 0167-6393
eISSN: 1872-7182
-
Minimum mean squared error based warped complex cepstrum analysis for statistical parametric speech synthesis
Ranniery Maia, Mark J. F. Gales, Yannis Stylianou, Masami Akamine
14TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2013), VOLS 1-5 2335-2339 2013
ISSN: 2308-457X
-
Photo-Realistic Expressive Text to Talking Head Synthesis
Vincent Wan, Robert Anderson, Art Blokland, Norbert Braunschweiler, Langzhou Chen, BalaKrishna Kolluru, Javier Latorre, Ranniery Maia, Bjoern Stenger, Kayoko Yanagisawa, Yannis Stylianou, Masami Akamine, Mark J. F. Gales, Roberto Cipolla
14TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2013), VOLS 1-5 2666-2668 2013
ISSN: 2308-457X
-
TRAINING A SUPRA-SEGMENTAL PARAMETRIC F0 MODEL WITHOUT INTERPOLATING F0
Javier Latorre, Mark J. F. Gales, Kate Knill, Masami Akamine
2013 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP) 6880-6884 2013
ISSN: 1520-6149
-
COMPLEX CEPSTRUM ANALYSIS BASED ON THE MINIMUM MEAN SQUARED ERROR
Ranniery Maia, Masami Akamine, M. J. F. Gales
2013 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP) 7972-7976 2013
ISSN: 1520-6149
-
INTEGRATED AUTOMATIC EXPRESSION PREDICTION AND SPEECH SYNTHESIS FROM TEXT
Langzhou Chen, Mark J. F. Gales, Norbert Braunschweiler, Masami Akamine, Kate Knill
2013 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP) 7977-7981 2013
ISSN: 1520-6149
-
Decision tree-based acoustic models for speech recognition
Masami Akamine, Jitendra Ajmera
EURASIP JOURNAL ON AUDIO SPEECH AND MUSIC PROCESSING 2012
DOI: 10.1186/1687-4722-2012-10
ISSN: 1687-4722
-
COMPLEX CEPSTRUM AS PHASE INFORMATION IN STATISTICAL PARAMETRIC SPEECH SYNTHESIS
Ranniery Maia, Masami Akamine, M. J. F. Gales
2012 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP) 4581-4584 2012
ISSN: 1520-6149
-
Exploring Rich Expressive Information from Audiobook Data Using Cluster Adaptive Training
Langzhou Chen, Mark J. F. Gales, Vincent Wan, Javier Latorre, Masami Akamine
13TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2012 (INTERSPEECH 2012), VOLS 1-3 958-961 2012
-
Speech factorization for HMM-TTS based on cluster adaptive training.
Javier Latorre, Vincent Wan, Mark J. F. Gales, Langzhou Chen, K. K. Chin, Kate Knill, Masami Akamine
13TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2012 (INTERSPEECH 2012), VOLS 1-3 970-973 2012
-
Combining multiple high quality corpora for improving HMM-TTS
Vincent Wan, Javier Latorre, K. K. Chin, Langzhou Chen, Mark J. F. Gales, Heiga Zen, Kate Knill, Masami Akamine
13TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2012 (INTERSPEECH 2012), VOLS 1-3 1134-1137 2012
-
Histogram-based spectral equalization for HMM-based speech synthesis using mel-LSP
Yamato Ohtani, Masatsune Tamura, Masahiro Morita, Takehiko Kagoshima, Masami Akamine
13TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2012 (INTERSPEECH 2012), VOLS 1-3 1154-1157 2012
-
HMM-based speech synthesis using sub-band basis spectrum model
Yamato Ohtani, Masatsune Tamura, Masahiro Morita, Takehiko Kagoshima, Masami Akamine
13TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2012 (INTERSPEECH 2012), VOLS 1-3 1438-1441 2012
-
Analysis on the Importance of Short-Term Speech Parameterizations for Emotional Statistical Parametric Speech Synthesis
Ranniery Maia, Masami Akamine
13TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2012 (INTERSPEECH 2012), VOLS 1-3 1630-1633 2012
-
Decision Tree-Based Acoustic Models for Speech Recognition with Improved Smoothness
Masami Akamine, Jitendra Ajmera
IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS E94D (11) 2250-2258 2011/11
DOI: 10.1587/transinf.E94.D.2250
ISSN: 1745-1361
-
CONTINUOUS F0 IN THE SOURCE-EXCITATION GENERATION FOR HMM-BASED TTS: DO WE NEED VOICEDIUNVOICED CLASSIFICATION?
Javier Latorre, Mark J. F. Gales, Sabine Buchholz, Kate Knill, Masatsune Tamura, Yamato Ohtani, Masami Akamine
2011 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING 4724-4727 2011
ISSN: 1520-6149
-
ONE SENTENCE VOICE ADAPTATION USING GMM-BASED FREQUENCY-WARPING AND SHIFT WITH A SUB-BAND BASIS SPECTRUM MODEL
Masatsune Tamura, Masahiro Morita, Takehiko Kagoshima, Masami Akamine
2011 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING 5124-5127 2011
ISSN: 1520-6149
-
COVARIANCE CLUSTERING ON RIEMANNIAN MANIFOLDS FOR ACOUSTIC MODEL COMPRESSION
Yusuke Shinohara, Takashi Masuko, Masami Akamine
2010 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING 4326-4329 2010
DOI: 10.1109/ICASSP.2010.5495661
ISSN: 1520-6149
-
UNIT SELECTION SPEECH SYNTHESIS USING MULTIPLE SPEECH UNITS AT NON-ADJACENT SEGMENTS FOR PROSODY AND WAVEFORM GENERATION
Masatsune Tamura, Norbert Braunschweiler, Takehiko Kagoshima, Masami Akamine
2010 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING 4802-4805 2010
DOI: 10.1109/ICASSP.2010.5495151
ISSN: 1520-6149
-
Sub-band Basis Spectrum Model for Pitch-synchronous Log-spectrum and Phase Based on Approximation of Sparse Coding
Masatsune Tamura, Takehiko Kagoshima, Masami Akamine
11TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2010 (INTERSPEECH 2010), VOLS 3 AND 4 2406-2409 2010
-
BAYESIAN FEATURE ENHANCEMENT USING A MIXTURE OF UNSCENTED TRANSFORMATIONS FOR UNCERTAINTY DECODING OF NOISY SPEECH
Yusuke Shinohara, Masami Akamine
2009 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOLS 1- 8, PROCEEDINGS 4569-4572 2009
DOI: 10.1109/ICASSP.2009.4960647
ISSN: 1520-6149
-
Decision Tree Acoustic Models for ASR
Jitendra Ajmera, Masami Akamine
INTERSPEECH 2009: 10TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2009, VOLS 1-5 1379-1382 2009
-
Feedback Loop for Prosody Prediction in Concatenative Speech Synthesis.
Javier Latorre, Sergio Gracia, Masami Akamine
INTERSPEECH 2009: 10TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2009, VOLS 1-5 2027-2030 2009
-
Speech Recognition using Soft Decision Trees
Jitendra Ajmera, Masami Akamine
INTERSPEECH 2008: 9TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2008, VOLS 1-5 940-943 2008
-
Comparative Evaluation of Different Methods for Voice Activity Detection
Hongfei Ding, Koichi Yamamoto, Masami Akamine
INTERSPEECH 2008: 9TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2008, VOLS 1-5 107-110 2008
-
Multilevel parametric-base F0 model for speech synthesis
Javier Latorre, Masami Akamine
INTERSPEECH 2008: 9TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2008, VOLS 1-5 2274-2277 2008
-
Feature enhancement by speaker-normalized splice for robust speech recognition
Yusuke Shinohara, Takashi Masuko, Masami Akamine
2008 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING, VOLS 1-12 4881-4884 2008
ISSN: 1520-6149
-
HMM-based Speech Recognition Using Decision Trees Instead of GMMs
Remco Teunen, Masami Akamine
INTERSPEECH 2007: 8TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION, VOLS 1-4 617-620 2007
-
Automatic Generation of Optimal Synthesis Units Based on Closed Loop Training.
篭嶋岳彦, 赤嶺政巳
電子情報通信学会論文誌 D-2 J83-D-2 (6) 2000
ISSN: 0915-1923
-
Toshiba English Text-to-Speech System (TESS) Peer-reviewed
C. K. Suh, T. Kagoshima, M. Morita, S. Seto, M. Akamine
Proc. Eurospeech99 2111-2114 1999
-
CELP speech coding based on an adaptive pulse position codebook Peer-reviewed
T. Amada, K. Miseki, M. Akamine
IEEE Proc. ICASSP99 13-16 1999
-
Analytic Generation of Synthesis Units by Closed Loop Training for Totally Speaker Driven Text to Speech System (TOS Drive TTS) Peer-reviewed
M. Akamine, T. Kagoshima
1927-1930 1998
-
An F0 Contour Control Model for Totally Speaker Driven Text to Speech System Peer-reviewed
T. Kagoshima, M. Morita, S. Seto, M. Akamine
IEEE Proc. ICSLP98 1975-1978 1998
-
Automatic Rule Generation for Linguistic Features Analysis Using Inductive Learning Technique-Linguistic Features Analysis in TOS Drive TTS System Peer-reviewed
S. Seto, M. Morita, T. Kagoshima, M. Akamine
IEEE Proc. ICSLP98 2031-2034 1998
-
A 2.4 Kbps Variable Bit Rate ADP-CELP Speech Coder Peer-reviewed
M. Oshikiri, M. Akamine
IEEE Proc. ICASSP 1 517-520 1998
-
Automatic Generation of Synthesis Units by Selection Based on Closed Loop Training.
篭嶋岳彦, 赤嶺政巳
電子情報通信学会論文誌 D-2 J81-D-2 (9) 1998
ISSN: 0915-1923
-
A 2.4kbps Variable Bit Rate ADP-CELP Speech Coder.
押切正浩, 赤嶺政巳
電子情報通信学会論文誌 A J81-A (11) 1998
ISSN: 0913-5707
-
Automatic Generation of Speech Synthesis Units Based on Closed Loop Training Peer-reviewed
T. Kagoshima, M. Akamine
IEEE Proc. ICASSP97 2 963-966 1997
-
Fast Excitation Codebook Search Based on the Orthogonalized Target Vector for CELP Speech Coding.
天田皇, 赤嶺政巳, 三関公生
電子情報通信学会論文誌 A 79 (5) 1996
ISSN: 0913-5707
-
Adaptive Density Pulse Excitation for Low Bit Rate Speech Coding Peer-reviewed
Masami Akamine, Kimio Miseki
IEICE Trans. E78 (2) 199-207 1995/02
-
Improvement of ADP-CELP Speech Coding at 4 Kbits/s Peer-reviewed
M. Akamine, K. Miseki, M. Oshikiri
IEEE Proc. GLOBECOM 1869-1873 1991
-
Efficient Excitation Model for Low Bit Rate Speech Coding
M. Akamine, K. Miseki
IEEE Proc. ISCAS 586-589 1991
-
Adaptive Bit-Allocation between the Pole-Zero Synthesis Filter and Excitation in CELP Peer-reviewed
K. Miseki, M. Akamine
229-232 1991
-
Error Free Calculation Precision of DCT in Image Coding.
菊池義池, 赤嶺政巳
電子情報通信学会論文誌 A 74 (7) 1991
ISSN: 0913-5707
-
CELP Coding with an Adaptive Density Pulse Excitation Model
M. Akamine, K. Miseki
IEEE Proc. ICASSP 29-32 1990
-
ARMA Model Based Speech Coding at 8 kb/s Peer-reviewed
M. Akamine, K. Miseki
IEEE Proc. ICASSP 148-151 1989
-
A class of limit cycle free floating-point digital filters with minimum roundoff noise.
赤嶺政巳, 樋口龍雄
電子情報通信学会論文誌 A 70 (5) 1987
ISSN: 0913-5707
-
State-Space Approach to Synthesis of Minimum Quantization Error Digital Filter Using Floating-Point Arithmetic Peer-reviewed
M. Akamine, T. Higuchi
IEEE Proc. ISCAS 3 1002-1005 1984/03
-
浮動小数点演算を用いた量子化誤差最小ディジタルフィルタの合成 Peer-reviewed
赤嶺政巳, 樋口龍雄
電子情報通信学会論文誌 A 66 (10) 895-902 1983/10
-
浮動小数点演算を用いたディジタルフィルタの状態方程式に基づく量子化誤差解析 Peer-reviewed
樋口龍雄, 赤嶺政巳
電子情報通信学会論文誌 A 66 (3) 186-193 1983/03
Misc. 68
-
Dereverberation Method to Improve Accuracy of Recognition of Spoken Language Collected by Distant Microphone
籠嶋岳彦, KIM Uihyun, 赤嶺政巳
東芝レビュー(Web) 73 (5) 2018
ISSN: 2432-1168
-
平静音声から予測した感情付与モデルに基づく統計的感情音声合成
大谷大和, 那須悠, 森田眞弘, 赤嶺政巳
日本音響学会研究発表会講演論文集(CD-ROM) 2015 2015
ISSN: 1880-7658
-
Statistical bandwidth extension using sub-band basis spectrum model
大谷大和, 田村正統, 森田眞弘, 赤嶺政巳
電子情報通信学会技術研究報告 114 (52(SP2014 1-45)) 2014
ISSN: 0913-5685
-
表情豊かな音声と顔画像を合成するシステムXpressiveTalkの開発
森中亮, 那須悠, 田村正統, WAN Vincenty, 柳澤佳代子, STENGER Bjorn, 森田眞弘, 籠嶋岳彦, 赤嶺政巳
日本音響学会研究発表会講演論文集(CD-ROM) 2014 2014
ISSN: 1880-7658
-
サブバンド基底スペクトルモデルを用いたGMMに基づく帯域拡張
大谷大和, 田村正統, 森田眞弘, 赤嶺政巳
日本音響学会研究発表会講演論文集(CD-ROM) 2014 2014
ISSN: 1880-7658
-
HMM音声合成における加算モデルに基づく任意話者への感情付与法の検討
大谷大和, 那須悠, 森中亮, 田村正統, 森田眞弘, 赤嶺政巳
日本音響学会研究発表会講演論文集(CD-ROM) 2014 2014
ISSN: 1880-7658
-
Shared emotion additive model for HMM-based emotional speech synthesis
大谷大和, 那須悠, 森中亮, 田村正統, 森田眞弘, 赤嶺政巳
電子情報通信学会技術研究報告 114 (303(SP2014 90-105)) 2014
ISSN: 0913-5685
-
サブバンド基底スペクトルモデルを用いたHMM音声合成
大谷大和, 田村正統, 森田眞弘, 籠嶋岳彦, 赤嶺政巳
日本音響学会研究発表会講演論文集(CD-ROM) 2013 2013
ISSN: 1880-7658
-
Speech Processing Technologies Becoming Common in Daily Life, and Toshiba’s Approach
赤嶺政巳
東芝レビュー 68 (9) 2013
ISSN: 0372-0462
-
Text to Speech Technologies in Toshiba-Closed-loop Training to Recent Development-
赤嶺政巳
電子情報通信学会技術研究報告 113 (366(SP2013 82-95)) 2013
ISSN: 0913-5685
-
HMM音声合成による英語音声合成システムの開発
田村正統, KRSTULOVIC Sacha, 森中亮, 徳田龍太郎, 全炳河, 森田眞弘, 籠嶋岳彦, 赤嶺政巳
日本音響学会研究発表会講演論文集(CD-ROM) 2011 2011
ISSN: 1880-7658
-
リーマン幾何学に基づく共分散クラスタリングによる音響モデルの圧縮
篠原雄介, 益子貴史, 赤嶺政巳
日本音響学会研究発表会講演論文集(CD-ROM) 2010 2010
ISSN: 1880-7658
-
耐雑音音声認識のためのアンセンテッド変換を用いた特徴強調法
篠原雄介, 赤嶺政巳
日本音響学会研究発表会講演論文集(CD-ROM) 2009 2009
ISSN: 1880-7658
-
Voice Activity Detection Technology with Robust Performance in Noisy Environments
山本幸一, 赤嶺政巳
東芝レビュー 64 (12) 2009
ISSN: 0372-0462
-
Generation of Speech Synthesis Units And F0 Control Rules Based on Closed-Loop Training
篭智岳彦, 赤嶺政巳, 瀬戸重宣, 森田真弘, 志賀芳則
電子情報通信学会技術研究報告 103 (632(SP2003 170-174)) 2004
ISSN: 0913-5685
-
FWFモデルを用いたピッチ波形の閉ループ学習
篭嶋岳彦, 赤嶺政巳
日本音響学会研究発表会講演論文集 2003 2003
ISSN: 1340-3168
-
スペクトル包絡を制御するためのピッチ波形のモデリング
篭嶋岳彦, 赤嶺政巳
日本音響学会研究発表会講演論文集 2003 2003
ISSN: 1340-3168
-
コンパクトなテキスト音声合成システムの開発
清水勇詞, 瀬戸重宣, 篭嶋岳彦, 赤嶺政巳
日本音響学会研究発表会講演論文集 2002 2002
ISSN: 1340-3168
-
TOS-Drive TTSの米・英・独・仏・中国語への応用
平林剛, 森田真弘, 徳田龍太郎, 篭嶋岳彦, 赤嶺政巳
日本音響学会研究発表会講演論文集 2002 2002
ISSN: 1340-3168
-
合成辞書作成に用いる音声DBの品質が合成音声に与える影響について
瀬戸重宣, 篭嶋岳彦, 土谷勝美, 赤嶺政巳
日本音響学会研究発表会講演論文集 2002 2002
ISSN: 1340-3168
-
サブバンド閉ループ学習による音声素片の生成
篭嶋岳彦, 赤嶺政巳
日本音響学会研究発表会講演論文集 2002 2002
ISSN: 1340-3168
-
音素HMMを環境適応的に選択して用いた競合モデルによる環境雑音のリジェクション
小柴亮典, 酒井優, 天田皇, 河村聡典, 正井康之, 赤嶺政巳
日本音響学会研究発表会講演論文集 2002 2002
ISSN: 1340-3168
-
An F0 Contour Control Model Using an F0 Contour Codebook.
篭嶋岳彦, 森田真弘, 瀬戸重宣, 赤嶺政巳, 志賀芳則
電子情報通信学会論文誌 D-2 J85-D-2 (6) 2002
ISSN: 0915-1923
-
多言語音声認識エンジンの開発
出口豊, 金沢博史, 赤嶺政巳
日本音響学会研究発表会講演論文集 2002 2002
ISSN: 1340-3168
-
ITS (Intelligent Transport Systems). Onboard Multimedia.
前田賢一, 赤嶺政巳, 加瀬直樹
東芝レビュー 55 (1) 2000
ISSN: 0372-0462
-
東芝パソコンの音声認識/合成ソフトウェア
正井康之, 桃崎浩平, 松浦博, 田中信一, 鈴木孝子, 赤嶺政巳, 山中紀子, 原義幸
電子情報通信学会大会講演論文集 2000 2000
ISSN: 1349-1369
-
Generation of phonemic unit corpus based on closed-loop traininng.
赤嶺政巳, 篭嶋岳彦
日本音響学会研究発表会講演論文集 1999 1999
ISSN: 1340-3168
-
Generating Accentuation Rules using Mora-by-Mora Accent Estimation.
森田真弘, 瀬戸重宣, 篭嶋岳彦, 赤嶺政巳
日本音響学会研究発表会講演論文集 1998 1998
ISSN: 1340-3168
-
Digital Signal Processor. A Method of memory saved speech synthesis for DSP.
新居孝章, 瀬戸重宣, 赤嶺政巳
日本音響学会研究発表会講演論文集 1998 1998
ISSN: 1340-3168
-
CELP speech coding using adaptive pulse position algebraic codebook.
天田皇, 三関公生, 赤嶺政巳
日本音響学会研究発表会講演論文集 1998 1998
ISSN: 1340-3168
-
Speech synthesis units coding based on vector quantization.
土谷勝美, 篭嶋岳彦, 赤嶺政巳
日本音響学会研究発表会講演論文集 1998 1998
ISSN: 1340-3168
-
An F0 contour control model using an F0 contour codebook.
篭嶋岳彦, 瀬戸重宣, 森田真弘, 赤嶺政巳
日本音響学会研究発表会講演論文集 1998 1998
ISSN: 1340-3168
-
A Speech/Silence Segmentation Method using Spectral Variation and the Application to a Variable Rate Speech Codec.
押切正浩, 赤嶺政巳
日本音響学会研究発表会講演論文集 1997 (Spring Pt 1) 1997
ISSN: 1340-3168
-
A Variable Bit Rate Speech Codec using Interframe Pitch Interpolation and Intraframe Pitch-vector Quantization.
押切正浩, 赤嶺政巳
日本音響学会研究発表会講演論文集 1997 1997
ISSN: 1340-3168
-
Automatic Generation of Speech Synthesis Units Based on Closed Loop Training. Generation of Optimal Synthesis units.
篭嶋岳彦, 赤嶺政巳
日本音響学会研究発表会講演論文集 1997 1997
ISSN: 1340-3168
-
Automatic Generation of Speech Synthesis Units Based on Closed Loop Training. Selection of Representative Units.
篭嶋岳彦, 赤嶺政巳
日本音響学会研究発表会講演論文集 1997 1997
ISSN: 1340-3168
-
CELP coding using pitch pattern.
天田皇, 赤嶺政巳
日本音響学会研究発表会講演論文集 1997 1997
ISSN: 1340-3168
-
Residue Excited LPC Synthesizer with High Quality Speech.
赤嶺政巳, 篭嶋岳彦, 土谷勝美
情報処理学会研究報告 97 (66(SLP-17)) 1997
ISSN: 0919-6072
-
Introduction of speech recognition and synthesis software of TOSHIBA Co.,Ltd.
松浦博, 正井康之, 原義幸, 新田恒雄, 赤嶺政巳, 瀬戸重宣, 太田治徳, 鈴木孝子, 小林賢一郎
情報処理学会研究報告 97 (66(SLP-17)) 1997
ISSN: 0919-6072
-
A Study on Voice Source Generation for Text-to-Speech Synthesis.
篭嶋岳彦, 赤嶺政巳
日本音響学会研究発表会講演論文集 1996 (Spring Pt 1) 1996
ISSN: 1340-3168
-
A study of reduction of complexity for 4kbps ADP-CELP speech coding.
天田皇, 赤嶺政巳, 三関公生
日本音響学会研究発表会講演論文集 1996 (Spring Pt 1) 1996
ISSN: 1340-3168
-
Speech Coding Using Binary-Modulated Vector Quantization.
三関公生, 天田皇, 押切正浩, 赤嶺政巳
日本音響学会研究発表会講演論文集 1995 (Autumn Pt 1) 1995
ISSN: 1340-3168
-
CELP speech coding using non-orthogonal codebook search.
天田皇, 三関公生, 赤嶺政巳
日本音響学会研究発表会講演論文集 1995 (Spring Pt 1) 1995
ISSN: 1340-3168
-
Non-orthogonal Codebook Search for Multiple-stage CELP Coders.
天田皇, 赤嶺政巳, 三関公生
電子情報通信学会技術研究報告 94 (372(SP94 53-62)) 1994
ISSN: 0913-5685
-
A study on speech coding using co-orthogonal basis transform.
三関公生, 赤嶺政巳, 天田皇, 押切正浩
電子情報通信学会大会講演論文集 1994 (Shuki Pt 1) 1994
ISSN: 1349-1369
-
CELP Coding with Individual Adaptive Codebooks for Voiced and Unvoiced Frame.
押切正浩, 赤嶺政巳, 三関公生
電子情報通信学会大会講演論文集 1994 (Shuki Pt 1) 1994
ISSN: 1349-1369
-
Non-orthogonal Codebook Search for CELP.
天田皇, 三関公生, 赤嶺政巳
電子情報通信学会大会講演論文集 1994 (Shuki Pt 1) 1994
ISSN: 1349-1369
-
3.75kb/s ADP-CELP speech coder.
三関公生, 赤嶺政巳, 押切正浩
電子情報通信学会技術研究報告 93 (156(SP93 44-48)) 1993
ISSN: 0913-5685
-
LPC Coefficients Quantization Method using Hybrid PARCOR-LSP Vector Quantization.
押切正浩, 赤嶺政巳, 三関公生
電子情報通信学会技術研究報告 93 (156(SP93 44-48)) 1993
ISSN: 0913-5685
-
Speech coding using an adaptive bit allocation between the pole-zero synthesis filter and excitation.
三関公生, 赤嶺政巳
電子情報通信学会全国大会講演論文集 1991 (Spring Pt 1) 1991
-
Variable rate speech coding for ATM networks based on sub-band coding.
吉川英隆, 赤嶺政巳, 三関公生, 工藤憲昌
電子情報通信学会全国大会講演論文集 1990 (Spring Pt.3) 1990
-
An adaptive kl transform coding with arithmetic coding.
菊池義浩, 塚原由利子, 赤嶺政巳
電子情報通信学会全国大会講演論文集 1990 (Spring Pt.7) 1990
-
Variable rate coding for ATM networks based on sub-band coding.
吉川英隆, 赤嶺政巳, 三関公生, 工藤憲昌
電子情報通信学会技術研究報告 89 (385(CS89 92-99)) 1990
ISSN: 0913-5685
-
A study on a implementation of ADP-CELP coding using DSP.
奥田裕二, 赤嶺政巳, 三関公生, 吉田博則
電子情報通信学会全国大会講演論文集 1990 (Spring Pt.1) 1990
-
Error sensitivity of parameters encoded by adp-celp coding.
神庭進, 三関公生, 赤嶺政巳
電子情報通信学会全国大会講演論文集 1990 (Spring Pt.1) 1990
-
Development of 4.8kbps ADP-CELP voice codec.
佐藤恭子, 渡辺栄一, 赤嶺政巳, 三関公生
電子情報通信学会全国大会講演論文集 1990 (Autumn Pt 3) 1990
-
Selection of transforms for adaptive KL transform coding with variable length code.
塚原由利子, 赤嶺政巳, 大関和夫
電子情報通信学会全国大会講演論文集 1990 (Autumn Pt 6) 1990
-
A speech coding based on ARMA model and adaptive density pulse model.
赤嶺政巳, 三関公生
電子情報通信学会全国大会講演論文集 1989 (Spring Pt.1) 1989
-
A CELP coding based on adaptive density pulse model.
赤嶺政巳, 三関公生
電子情報通信学会全国大会講演論文集 1989 (Autumn Pt.1) 1989
-
Analysis of roundoff error in the fast DCT algorithm.
菊池義浩, 赤嶺政巳
電子情報通信学会全国大会講演論文集 1989 (Autumn Pt.6) 1989
-
An adaptive KL transform coding with adaptive bit allocation.
赤嶺政巳, 塚原由利子, 大関和夫
電子情報通信学会全国大会講演論文集 1989 (Autumn Pt.6) 1989
-
Improved multi-pulse speech coding using An adaptive compensation filter.
三関公生, 赤嶺政巳
電子情報通信学会全国大会講演論文集 1989 (Autumn Pt.1) 1989
-
Speech quality of an ARMA analysis-synthesis system based on inverse spectrum.
赤嶺政巳, 三関公生
電子情報通信学会技術研究報告 87 (347) 1988
ISSN: 0913-5685
-
An improvement on ARMA speech analysis.
赤嶺政巳, 三関公生
電子情報通信学会全国大会講演論文集 1988 (Pt. A-1) 1988
-
A study on 8kbps speech coding using ARMA model.
赤嶺政巳
電子情報通信学会全国大会講演論文集 1988 (Autumn Pt. A-1) 1988
-
An efficient expression for multi-pulse excition using an adaptive compensation filter.
三関公生, 赤嶺政巳
電子情報通信学会技術研究報告 88 (214) 1988
ISSN: 0913-5685
-
Multi-pulse speech coding using an adaptive compensation filter.
三関公生, 赤嶺政巳
電子情報通信学会全国大会講演論文集 1988 (Autumn Pt. A-1) 1988
-
ARMA analysis of speech based on inverse spectrum and autocorrelation method.
赤嶺政巳
電子情報通信学会技術研究報告 87 (306) 1987
ISSN: 0913-5685
Industrial Property Rights 20
-
対話システム、対話装置、対話方法、及びプログラム
岩田 憲治, 藤村 浩司, 小林 優佳, 吉田 尚水, 赤嶺 政巳
特許第7132090号
Property Type: Patent
-
対話システム、方法、及びプログラム
吉田 尚水, 岩田 憲治, 小林 優佳, 赤嶺 政巳
特許第7035239号
Property Type: Patent
-
対話システム、対話方法および対話プログラム
赤嶺 政巳, 吉田 尚水
特許第6805112号
Property Type: Patent
-
対話フロー制御装置、対話フロー制御方法およびプログラム
下郡 祐美子, 永江 尚義, 岩田 憲治, 赤嶺 政巳
特許第6553007号
Property Type: Patent
-
音声合成方法、装置及びプログラム
赤嶺 政巳, ラトーレ・マルティネス・ハビエル, ワン・ビンセント・ピン・ルン, チン・カン・クホン, ゲールズ・マーク・ジョン・フランシス, ニル・キャサリン・マリー, チュン・ビュン・ハ
特許第6246777号
Property Type: Patent
-
テキスト読み上げシステム
赤嶺 政巳, ラトーレ・マルティネス・ハビエル, ワン・ビンセント・ピン・ルン, チン・カン・クホン, ゲールズ・マーク・ジョン・フランシス, ニル・キャサリン・マリー
特許第6092293号
Property Type: Patent
-
テキスト音声合成方法及びシステム
赤嶺 政巳, ラトーレ・マルティネス・ハビエル, ワン・ビンセント・ピン・ルン, チン・カン・クホン, ゲールズ・マーク・ジョン・フランシス, ニル・キャサリン・マリー, チュン・ビュン・ハ
特許第5847917号
Property Type: Patent
-
音声処理システム
赤嶺 政巳, ランジョウ・チェン, マーク・ジョン・フランクルズ・ゲールズ, キャサリン・メリー・ニル
特許第5768093号
Property Type: Patent
-
テキスト音声合成方法及びシステム
赤嶺 政巳, ラトーレ・マルティネス・ハビエル, ワン・ビンセント・ピン・ルン, チン・カン・クホン, ゲールズ・マーク・ジョン・フランシス, ニル・キャサリン・マリー, チュン・ビュン・ハ
特許第5659258号
Property Type: Patent
-
音声モデル生成装置、音声合成装置、音声モデル生成プログラム、音声合成プログラム、音声モデル生成方法および音声合成方法
ラトレ ハビエル, 赤嶺 政巳
特許第5457706号
Property Type: Patent
-
対話システム、方法、及びプログラム
吉田 尚水, 岩田 憲治, 小林 優佳, 赤嶺 政巳
Property Type: Patent
-
対話システム、対話装置、対話方法、及びプログラム
岩田 憲治, 藤村 浩司, 小林 優佳, 吉田 尚水, 赤嶺 政巳
Property Type: Patent
-
対話システム、対話方法および対話プログラム
赤嶺 政巳, 吉田 尚水
Property Type: Patent
-
対話システム、方法、及びプログラム
吉田 尚水, 岩田 憲治, 小林 優佳, 赤嶺 政巳
Property Type: Patent
-
対話フロー制御装置、対話フロー制御方法およびプログラム
下郡 祐美子, 永江 尚義, 岩田 憲治, 赤嶺 政巳
Property Type: Patent
-
音声合成方法、装置及びプログラム
赤嶺 政巳, ラトーレ・マルティネス・ハビエル, ワン・ビンセント・ピン・ルン, チン・カン・クホン, ゲールズ・マーク・ジョン・フランシス, ニル・キャサリン・マリー, チュン・ビュン・ハ
Property Type: Patent
-
音声処理システム
赤嶺 政巳, ランジョウ・チェン, マーク・ジョン・フランクルズ・ゲールズ, キャサリン・メリー・ニル
Property Type: Patent
-
テキスト読み上げシステム
赤嶺 政巳, ラトーレ・マルティネス・ハビエル, ワン・ビンセント・ピン・ルン, チン・カン・クホン, ゲールズ・マーク・ジョン・フランシス, ニル・キャサリン・マリー
Property Type: Patent
-
テキスト音声合成方法及びシステム
赤嶺 政巳, ラトーレ・マルティネス・ハビエル, ワン・ビンセント・ピン・ルン, チン・カン・クホン, ゲールズ・マーク・ジョン・フランシス, ニル・キャサリン・マリー, チュン・ビュン・ハ
Property Type: Patent
-
音声処理システム
赤嶺 政巳, ランジョウ・チェン, マーク・ジョン・フランクルズ・ゲールズ, キャサリン・メリー・ニル
Property Type: Patent
Academic Activities 13
-
電子情報通信学会論文査読委員
1997/04 - Present
-
IEEE論文査読委員
2007/01 - 2023/12
-
IEEE Speech and Language Technical Committeeメンバー
2018/01 - 2020/12
-
Asia-Pacific Signal and Information Processing Association Industrial membership Committeeメンバー
2016/04 - 2019/12
-
ISCA Industrial Liaison Committee委員
2010/01 - 2019/12
-
IEEE Spoken Language Technology Workshop (SLT), Organizing Committeeメンバー
2018/01 - 2018/12
-
ISCA主催国際会議 (Interspeech 2008、2010、2012、2013、2014、2015、2018)
2008/01 - 2018/12
-
IEEE Automatic Speech Recognition and Understanding Workshop (ASRU) 2017, Organizing Committeeメンバー
2017/04 - 2017/12
-
IEEE主催国際会議 (ICASSP 2012、2013、2014)セッションチェアー
2012/01 - 2014/12
-
IEEE Speech and Language Technical Committeeメンバー
2012/01 - 2013/12
-
IEEE CHiME-2013 ボードメンバー
2013/01 - 2013/06
-
ISCA Speech Synthesis Workshop (SSW7)プログラム委員
2010/01 - 2010/12
-
電子情報通信学会論文誌特集号編集委員
1997/01 - 1997/12