-
工学博士(東北大学)
-
工学修士(東北大学)
研究者詳細
経歴 14
-
2025年11月 ~ 継続中東北大学 高等大学院機構 教授
-
2019年4月 ~ 2025年10月東北大学 大学院工学研究科 特任教授
-
2018年4月 ~ 2019年3月東芝研究開発センター・メディアAIラボラトリー シニアフェロー
-
2016年4月 ~ 2019年3月慶應義塾大学理工学研究科 非常勤特任教授
-
2015年4月 ~ 2018年3月東芝リサーチ・コンサルティング シニアフェロー
-
2005年4月 ~ 2015年3月東芝研究開発センター 技監
-
2004年4月 ~ 2005年3月東芝研究開発センター・特別研究室 研究主幹
-
2002年4月 ~ 2004年3月東芝研究開発センター 研究企画室グループ長
-
2000年4月 ~ 2002年3月東芝研究開発センター・マルチメディアラボラトリー 室長
-
2000年4月 ~ 2001年3月和歌山大学大学院システム工学研究科 非常勤講師
-
1997年4月 ~ 2000年3月東芝研究開発センター・関西研究所 ラボリーダー
-
1994年4月 ~ 1997年3月東芝研究開発センター・情報通信システム研究所 主任研究員
-
1989年4月 ~ 1994年3月東芝研究開発センター・情報通信システム研究所 研究主務
-
1985年4月 ~ 1989年3月東芝総合研究所(平成4年から研究開発センターに改名)・電子機器研究所 研究員
学歴 2
-
東北大学 大学院工学研究科博士後期課程 電子工学専攻
1982年4月 ~ 1985年3月
-
東北大学 大学院工学研究科博士前期課程 情報工学専攻
1980年4月 ~ 1982年3月
所属学協会 4
-
電子情報通信学会名誉員
2022年6月 ~ 継続中
-
APSIPA (Asia Pacific Signal and Information Processing Association)
2008年1月 ~ 継続中
-
ISCA (International Speech Communication Association)
2003年1月 ~ 継続中
-
IEEE
1984年1月 ~ 2023年12月
研究キーワード 6
-
機械学習
-
ディジタル信号処理
-
音声対話
-
音声符号化
-
音声認識
-
音声合成
研究分野 1
-
情報通信 / ヒューマンインタフェース、インタラクション / 音声処理
受賞 10
-
功績賞
2020年6月 電子情報通信学会
-
紫綬褒章
2013年4月 内閣府
-
業績賞
2012年5月 電子情報通信学会
-
全国発明表彰内閣総理大臣発明賞
2008年6月 発明協会
-
連作論文賞
2003年9月 電子情報通信学会
-
市村産業賞功績賞
2003年4月 新技術開発財団
-
技術開発賞
2002年5月 日本音響学会
-
文部科学大臣賞研究功績者
2001年4月 文部科学省
-
テレコムシステム技術賞
2001年3月 電気通信普及財団
-
篠原記念学術奨励賞
1989年3月 電子情報通信学会
論文 60
-
Dialog State Tracking for Unseen Values Using an Extended Attention Mechanism
Takami Yoshida, Kenji Iwata, Hiroshi Fujimura, Masami Akamine
9TH INTERNATIONAL WORKSHOP ON SPOKEN DIALOGUE SYSTEM TECHNOLOGY 579 77-89 2019年
DOI: 10.1007/978-981-13-9443-0_7
ISSN:1876-1100
eISSN:1876-1119
-
OUT-OF-DOMAIN SLOT VALUE DETECTION FOR SPOKEN DIALOGUE SYSTEMS WITH CONTEXT INFORMATION
Yuka Kobayashi, Takami Yoshida, Kenji Iwata, Hiroshi Fujimura, Masami Akamine
2018 IEEE WORKSHOP ON SPOKEN LANGUAGE TECHNOLOGY (SLT 2018) 854-861 2018年
ISSN:2639-5479
-
Near and Far Field Speech-in-Noise Intelligibility Improvements Based on a Time-Frequency Energy Reallocation Approach
Tudor-Catalin Zorila, Yannis Stylianou, Tatsuma Ishihara, Masami Akamine
IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING 24 (10) 1808-1818 2016年10月
DOI: 10.1109/TASLP.2016.2585864
ISSN:2329-9290
eISSN:2329-9304
-
Statistical Bandwidth Extension for Speech Synthesis Based on Gaussian Mixture Model with Sub-Band Basis Spectrum Model
Yamato Ohtani, Masatsune Tamura, Masahiro Morita, Masami Akamine
IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS E99D (10) 2481-2489 2016年10月
DOI: 10.1587/transinf.2016SLP0006
ISSN:1745-1361
-
Voice Activity Detection: Merging Source and Filter-based Information
Thomas Drugman, Yannis Stylianou, Yusuke Kida, Masami Akamine
IEEE SIGNAL PROCESSING LETTERS 23 (2) 252-256 2016年2月
ISSN:1070-9908
eISSN:1558-2361
-
Emotional transplant in statistical speech synthesis based on emotion additive model
Yaniato Ohtani, Yu Nasu, Masahiro Morita, Masami Akamine
16TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2015), VOLS 1-5 274-278 2015年
-
A Maximum Likelihood Approach to the Detection of Moments of Maximum Excitation and its Application to High-Quality Speech Parameterization
Ranniery Maia, Yannis Stylianou, Masami Akamine
16TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2015), VOLS 1-5 603-607 2015年
-
On the impact of excitation and spectral parameters for expressive statistical parametric speech synthesis
Ranniery Maia, Masami Akamine
COMPUTER SPEECH AND LANGUAGE 28 (5) 1209-1232 2014年9月
DOI: 10.1016/j.csl.2013.10.001
ISSN:0885-2308
eISSN:1095-8363
-
Building HMM-TTS Voices on Diverse Data
Vincent Wan, Javier Latorre, Kayoko Yanagisawa, Norbert Braunschweiler, Langzhou Chen, Mark J. F. Gales, Masami Akamine
IEEE JOURNAL OF SELECTED TOPICS IN SIGNAL PROCESSING 8 (2) 296-306 2014年4月
DOI: 10.1109/JSTSP.2013.2295058
ISSN:1932-4553
eISSN:1941-0484
-
Integrated Expression Prediction and Speech Synthesis From Text
Langzhou Chen, Mark J. F. Gales, Norbert Braunschweiler, Masami Akamine, Kate Knill
IEEE JOURNAL OF SELECTED TOPICS IN SIGNAL PROCESSING 8 (2) 323-335 2014年4月
DOI: 10.1109/JSTSP.2013.2294938
ISSN:1932-4553
eISSN:1941-0484
-
Complex cepstrum for statistical parametric speech synthesis
Ranniery Maia, Masami Akamine, Mark J. F. Gales
SPEECH COMMUNICATION 55 (5) 606-618 2013年6月
DOI: 10.1016/j.specom.2012.12.008
ISSN:0167-6393
eISSN:1872-7182
-
Minimum mean squared error based warped complex cepstrum analysis for statistical parametric speech synthesis
Ranniery Maia, Mark J. F. Gales, Yannis Stylianou, Masami Akamine
14TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2013), VOLS 1-5 2335-2339 2013年
ISSN:2308-457X
-
Photo-Realistic Expressive Text to Talking Head Synthesis
Vincent Wan, Robert Anderson, Art Blokland, Norbert Braunschweiler, Langzhou Chen, BalaKrishna Kolluru, Javier Latorre, Ranniery Maia, Bjoern Stenger, Kayoko Yanagisawa, Yannis Stylianou, Masami Akamine, Mark J. F. Gales, Roberto Cipolla
14TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2013), VOLS 1-5 2666-2668 2013年
ISSN:2308-457X
-
TRAINING A SUPRA-SEGMENTAL PARAMETRIC F0 MODEL WITHOUT INTERPOLATING F0
Javier Latorre, Mark J. F. Gales, Kate Knill, Masami Akamine
2013 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP) 6880-6884 2013年
ISSN:1520-6149
-
COMPLEX CEPSTRUM ANALYSIS BASED ON THE MINIMUM MEAN SQUARED ERROR
Ranniery Maia, Masami Akamine, M. J. F. Gales
2013 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP) 7972-7976 2013年
ISSN:1520-6149
-
INTEGRATED AUTOMATIC EXPRESSION PREDICTION AND SPEECH SYNTHESIS FROM TEXT
Langzhou Chen, Mark J. F. Gales, Norbert Braunschweiler, Masami Akamine, Kate Knill
2013 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP) 7977-7981 2013年
ISSN:1520-6149
-
Decision tree-based acoustic models for speech recognition
Masami Akamine, Jitendra Ajmera
EURASIP JOURNAL ON AUDIO SPEECH AND MUSIC PROCESSING 2012年
DOI: 10.1186/1687-4722-2012-10
ISSN:1687-4722
-
COMPLEX CEPSTRUM AS PHASE INFORMATION IN STATISTICAL PARAMETRIC SPEECH SYNTHESIS
Ranniery Maia, Masami Akamine, M. J. F. Gales
2012 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP) 4581-4584 2012年
ISSN:1520-6149
-
Exploring Rich Expressive Information from Audiobook Data Using Cluster Adaptive Training
Langzhou Chen, Mark J. F. Gales, Vincent Wan, Javier Latorre, Masami Akamine
13TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2012 (INTERSPEECH 2012), VOLS 1-3 958-961 2012年
-
Speech factorization for HMM-TTS based on cluster adaptive training.
Javier Latorre, Vincent Wan, Mark J. F. Gales, Langzhou Chen, K. K. Chin, Kate Knill, Masami Akamine
13TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2012 (INTERSPEECH 2012), VOLS 1-3 970-973 2012年
-
Combining multiple high quality corpora for improving HMM-TTS
Vincent Wan, Javier Latorre, K. K. Chin, Langzhou Chen, Mark J. F. Gales, Heiga Zen, Kate Knill, Masami Akamine
13TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2012 (INTERSPEECH 2012), VOLS 1-3 1134-1137 2012年
-
Histogram-based spectral equalization for HMM-based speech synthesis using mel-LSP
Yamato Ohtani, Masatsune Tamura, Masahiro Morita, Takehiko Kagoshima, Masami Akamine
13TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2012 (INTERSPEECH 2012), VOLS 1-3 1154-1157 2012年
-
HMM-based speech synthesis using sub-band basis spectrum model
Yamato Ohtani, Masatsune Tamura, Masahiro Morita, Takehiko Kagoshima, Masami Akamine
13TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2012 (INTERSPEECH 2012), VOLS 1-3 1438-1441 2012年
-
Analysis on the Importance of Short-Term Speech Parameterizations for Emotional Statistical Parametric Speech Synthesis
Ranniery Maia, Masami Akamine
13TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2012 (INTERSPEECH 2012), VOLS 1-3 1630-1633 2012年
-
Decision Tree-Based Acoustic Models for Speech Recognition with Improved Smoothness
Masami Akamine, Jitendra Ajmera
IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS E94D (11) 2250-2258 2011年11月
DOI: 10.1587/transinf.E94.D.2250
ISSN:1745-1361
-
CONTINUOUS F0 IN THE SOURCE-EXCITATION GENERATION FOR HMM-BASED TTS: DO WE NEED VOICEDIUNVOICED CLASSIFICATION?
Javier Latorre, Mark J. F. Gales, Sabine Buchholz, Kate Knill, Masatsune Tamura, Yamato Ohtani, Masami Akamine
2011 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING 4724-4727 2011年
ISSN:1520-6149
-
ONE SENTENCE VOICE ADAPTATION USING GMM-BASED FREQUENCY-WARPING AND SHIFT WITH A SUB-BAND BASIS SPECTRUM MODEL
Masatsune Tamura, Masahiro Morita, Takehiko Kagoshima, Masami Akamine
2011 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING 5124-5127 2011年
ISSN:1520-6149
-
COVARIANCE CLUSTERING ON RIEMANNIAN MANIFOLDS FOR ACOUSTIC MODEL COMPRESSION
Yusuke Shinohara, Takashi Masuko, Masami Akamine
2010 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING 4326-4329 2010年
DOI: 10.1109/ICASSP.2010.5495661
ISSN:1520-6149
-
UNIT SELECTION SPEECH SYNTHESIS USING MULTIPLE SPEECH UNITS AT NON-ADJACENT SEGMENTS FOR PROSODY AND WAVEFORM GENERATION
Masatsune Tamura, Norbert Braunschweiler, Takehiko Kagoshima, Masami Akamine
2010 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING 4802-4805 2010年
DOI: 10.1109/ICASSP.2010.5495151
ISSN:1520-6149
-
Sub-band Basis Spectrum Model for Pitch-synchronous Log-spectrum and Phase Based on Approximation of Sparse Coding
Masatsune Tamura, Takehiko Kagoshima, Masami Akamine
11TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2010 (INTERSPEECH 2010), VOLS 3 AND 4 2406-2409 2010年
-
BAYESIAN FEATURE ENHANCEMENT USING A MIXTURE OF UNSCENTED TRANSFORMATIONS FOR UNCERTAINTY DECODING OF NOISY SPEECH
Yusuke Shinohara, Masami Akamine
2009 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOLS 1- 8, PROCEEDINGS 4569-4572 2009年
DOI: 10.1109/ICASSP.2009.4960647
ISSN:1520-6149
-
Decision Tree Acoustic Models for ASR
Jitendra Ajmera, Masami Akamine
INTERSPEECH 2009: 10TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2009, VOLS 1-5 1379-1382 2009年
-
Feedback Loop for Prosody Prediction in Concatenative Speech Synthesis.
Javier Latorre, Sergio Gracia, Masami Akamine
INTERSPEECH 2009: 10TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2009, VOLS 1-5 2027-2030 2009年
-
Speech Recognition using Soft Decision Trees
Jitendra Ajmera, Masami Akamine
INTERSPEECH 2008: 9TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2008, VOLS 1-5 940-943 2008年
-
Comparative Evaluation of Different Methods for Voice Activity Detection
Hongfei Ding, Koichi Yamamoto, Masami Akamine
INTERSPEECH 2008: 9TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2008, VOLS 1-5 107-110 2008年
-
Multilevel parametric-base F0 model for speech synthesis
Javier Latorre, Masami Akamine
INTERSPEECH 2008: 9TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2008, VOLS 1-5 2274-2277 2008年
-
Feature enhancement by speaker-normalized splice for robust speech recognition
Yusuke Shinohara, Takashi Masuko, Masami Akamine
2008 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING, VOLS 1-12 4881-4884 2008年
ISSN:1520-6149
-
HMM-based Speech Recognition Using Decision Trees Instead of GMMs
Remco Teunen, Masami Akamine
INTERSPEECH 2007: 8TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION, VOLS 1-4 617-620 2007年
-
閉ループ学習に基づく最適な音声素片の解析的生成
篭嶋岳彦, 赤嶺政巳
電子情報通信学会論文誌 D-2 J83-D-2 (6) 2000年
ISSN:0915-1923
-
Toshiba English Text-to-Speech System (TESS) 査読有り
C. K. Suh, T. Kagoshima, M. Morita, S. Seto, M. Akamine
Proc. Eurospeech99 2111-2114 1999年
-
CELP speech coding based on an adaptive pulse position codebook 査読有り
T. Amada, K. Miseki, M. Akamine
IEEE Proc. ICASSP99 13-16 1999年
-
Analytic Generation of Synthesis Units by Closed Loop Training for Totally Speaker Driven Text to Speech System (TOS Drive TTS) 査読有り
M. Akamine, T. Kagoshima
1927-1930 1998年
-
An F0 Contour Control Model for Totally Speaker Driven Text to Speech System 査読有り
T. Kagoshima, M. Morita, S. Seto, M. Akamine
IEEE Proc. ICSLP98 1975-1978 1998年
-
Automatic Rule Generation for Linguistic Features Analysis Using Inductive Learning Technique-Linguistic Features Analysis in TOS Drive TTS System 査読有り
S. Seto, M. Morita, T. Kagoshima, M. Akamine
IEEE Proc. ICSLP98 2031-2034 1998年
-
A 2.4 Kbps Variable Bit Rate ADP-CELP Speech Coder 査読有り
M. Oshikiri, M. Akamine
IEEE Proc. ICASSP 1 517-520 1998年
-
閉ループ学習に基づく代表素片選択による音声素片の自動生成
篭嶋岳彦, 赤嶺政巳
電子情報通信学会論文誌 D-2 J81-D-2 (9) 1998年
ISSN:0915-1923
-
2.4kbps可変レートADP-CELP音声符号化
押切正浩, 赤嶺政巳
電子情報通信学会論文誌 A J81-A (11) 1998年
ISSN:0913-5707
-
Automatic Generation of Speech Synthesis Units Based on Closed Loop Training 査読有り
T. Kagoshima, M. Akamine
IEEE Proc. ICASSP97 2 963-966 1997年
-
CELP音声符号化における目標ベクトルの直交化に基づいた励振符号帳の高速探索
天田皇, 赤嶺政巳, 三関公生
電子情報通信学会論文誌 A 79 (5) 1996年
ISSN:0913-5707
-
Adaptive Density Pulse Excitation for Low Bit Rate Speech Coding 査読有り
Masami Akamine, Kimio Miseki
IEICE Trans. E78 (2) 199-207 1995年2月
-
Improvement of ADP-CELP Speech Coding at 4 Kbits/s 査読有り
M. Akamine, K. Miseki, M. Oshikiri
IEEE Proc. GLOBECOM 1869-1873 1991年
-
Efficient Excitation Model for Low Bit Rate Speech Coding
M. Akamine, K. Miseki
IEEE Proc. ISCAS 586-589 1991年
-
Adaptive Bit-Allocation between the Pole-Zero Synthesis Filter and Excitation in CELP 査読有り
K. Miseki, M. Akamine
229-232 1991年
-
DCTを用いた画像符号化における完全再生可能なDCT演算精度
菊池義池, 赤嶺政巳
電子情報通信学会論文誌 A 74 (7) 1991年
ISSN:0913-5707
-
CELP Coding with an Adaptive Density Pulse Excitation Model
M. Akamine, K. Miseki
IEEE Proc. ICASSP 29-32 1990年
-
ARMA Model Based Speech Coding at 8 kb/s 査読有り
M. Akamine, K. Miseki
IEEE Proc. ICASSP 148-151 1989年
-
浮動小数点演算を用いたリミットサイクルのない演算誤差最小ディジタルフィルタのクラスについて
赤嶺政巳, 樋口龍雄
電子情報通信学会論文誌 A 70 (5) 1987年
ISSN:0913-5707
-
State-Space Approach to Synthesis of Minimum Quantization Error Digital Filter Using Floating-Point Arithmetic 査読有り
M. Akamine, T. Higuchi
IEEE Proc. ISCAS 3 1002-1005 1984年3月
-
浮動小数点演算を用いた量子化誤差最小ディジタルフィルタの合成 査読有り
赤嶺政巳, 樋口龍雄
電子情報通信学会論文誌 A 66 (10) 895-902 1983年10月
-
浮動小数点演算を用いたディジタルフィルタの状態方程式に基づく量子化誤差解析 査読有り
樋口龍雄, 赤嶺政巳
電子情報通信学会論文誌 A 66 (3) 186-193 1983年3月
MISC 68
-
遠隔マイクで集音した音声の認識精度を向上させる残響抑圧技術
籠嶋岳彦, KIM Uihyun, 赤嶺政巳
東芝レビュー(Web) 73 (5) 2018年
ISSN: 2432-1168
-
平静音声から予測した感情付与モデルに基づく統計的感情音声合成
大谷大和, 那須悠, 森田眞弘, 赤嶺政巳
日本音響学会研究発表会講演論文集(CD-ROM) 2015 2015年
ISSN: 1880-7658
-
サブバンド基底スペクトルモデルを利用した統計的帯域拡張法
大谷大和, 田村正統, 森田眞弘, 赤嶺政巳
電子情報通信学会技術研究報告 114 (52(SP2014 1-45)) 2014年
ISSN: 0913-5685
-
表情豊かな音声と顔画像を合成するシステムXpressiveTalkの開発
森中亮, 那須悠, 田村正統, WAN Vincenty, 柳澤佳代子, STENGER Bjorn, 森田眞弘, 籠嶋岳彦, 赤嶺政巳
日本音響学会研究発表会講演論文集(CD-ROM) 2014 2014年
ISSN: 1880-7658
-
サブバンド基底スペクトルモデルを用いたGMMに基づく帯域拡張
大谷大和, 田村正統, 森田眞弘, 赤嶺政巳
日本音響学会研究発表会講演論文集(CD-ROM) 2014 2014年
ISSN: 1880-7658
-
HMM音声合成における加算モデルに基づく任意話者への感情付与法の検討
大谷大和, 那須悠, 森中亮, 田村正統, 森田眞弘, 赤嶺政巳
日本音響学会研究発表会講演論文集(CD-ROM) 2014 2014年
ISSN: 1880-7658
-
HMMに基づく感情音声合成のための共有感情付与モデル
大谷大和, 那須悠, 森中亮, 田村正統, 森田眞弘, 赤嶺政巳
電子情報通信学会技術研究報告 114 (303(SP2014 90-105)) 2014年
ISSN: 0913-5685
-
サブバンド基底スペクトルモデルを用いたHMM音声合成
大谷大和, 田村正統, 森田眞弘, 籠嶋岳彦, 赤嶺政巳
日本音響学会研究発表会講演論文集(CD-ROM) 2013 2013年
ISSN: 1880-7658
-
身近になった音声処理技術と東芝の取組み
赤嶺政巳
東芝レビュー 68 (9) 2013年
ISSN: 0372-0462
-
東芝の音声合成技術-閉ループ学習から最近の取り組みまで-
赤嶺政巳
電子情報通信学会技術研究報告 113 (366(SP2013 82-95)) 2013年
ISSN: 0913-5685
-
HMM音声合成による英語音声合成システムの開発
田村正統, KRSTULOVIC Sacha, 森中亮, 徳田龍太郎, 全炳河, 森田眞弘, 籠嶋岳彦, 赤嶺政巳
日本音響学会研究発表会講演論文集(CD-ROM) 2011 2011年
ISSN: 1880-7658
-
リーマン幾何学に基づく共分散クラスタリングによる音響モデルの圧縮
篠原雄介, 益子貴史, 赤嶺政巳
日本音響学会研究発表会講演論文集(CD-ROM) 2010 2010年
ISSN: 1880-7658
-
耐雑音音声認識のためのアンセンテッド変換を用いた特徴強調法
篠原雄介, 赤嶺政巳
日本音響学会研究発表会講演論文集(CD-ROM) 2009 2009年
ISSN: 1880-7658
-
雑音にロバストな音声と非音声の判別技術
山本幸一, 赤嶺政巳
東芝レビュー 64 (12) 2009年
ISSN: 0372-0462
-
閉ループ学習に基づく音声素片および基本周波数制御規則の生成
篭智岳彦, 赤嶺政巳, 瀬戸重宣, 森田真弘, 志賀芳則
電子情報通信学会技術研究報告 103 (632(SP2003 170-174)) 2004年
ISSN: 0913-5685
-
FWFモデルを用いたピッチ波形の閉ループ学習
篭嶋岳彦, 赤嶺政巳
日本音響学会研究発表会講演論文集 2003 2003年
ISSN: 1340-3168
-
スペクトル包絡を制御するためのピッチ波形のモデリング
篭嶋岳彦, 赤嶺政巳
日本音響学会研究発表会講演論文集 2003 2003年
ISSN: 1340-3168
-
コンパクトなテキスト音声合成システムの開発
清水勇詞, 瀬戸重宣, 篭嶋岳彦, 赤嶺政巳
日本音響学会研究発表会講演論文集 2002 2002年
ISSN: 1340-3168
-
TOS-Drive TTSの米・英・独・仏・中国語への応用
平林剛, 森田真弘, 徳田龍太郎, 篭嶋岳彦, 赤嶺政巳
日本音響学会研究発表会講演論文集 2002 2002年
ISSN: 1340-3168
-
合成辞書作成に用いる音声DBの品質が合成音声に与える影響について
瀬戸重宣, 篭嶋岳彦, 土谷勝美, 赤嶺政巳
日本音響学会研究発表会講演論文集 2002 2002年
ISSN: 1340-3168
-
サブバンド閉ループ学習による音声素片の生成
篭嶋岳彦, 赤嶺政巳
日本音響学会研究発表会講演論文集 2002 2002年
ISSN: 1340-3168
-
音素HMMを環境適応的に選択して用いた競合モデルによる環境雑音のリジェクション
小柴亮典, 酒井優, 天田皇, 河村聡典, 正井康之, 赤嶺政巳
日本音響学会研究発表会講演論文集 2002 2002年
ISSN: 1340-3168
-
代表パターンコードブックを用いた基本周波数制御法
篭嶋岳彦, 森田真弘, 瀬戸重宣, 赤嶺政巳, 志賀芳則
電子情報通信学会論文誌 D-2 J85-D-2 (6) 2002年
ISSN: 0915-1923
-
多言語音声認識エンジンの開発
出口豊, 金沢博史, 赤嶺政巳
日本音響学会研究発表会講演論文集 2002 2002年
ISSN: 1340-3168
-
ITS(高度道路交通システム) 車載マルチメディア
前田賢一, 赤嶺政巳, 加瀬直樹
東芝レビュー 55 (1) 2000年
ISSN: 0372-0462
-
東芝パソコンの音声認識/合成ソフトウェア
正井康之, 桃崎浩平, 松浦博, 田中信一, 鈴木孝子, 赤嶺政巳, 山中紀子, 原義幸
電子情報通信学会大会講演論文集 2000 2000年
ISSN: 1349-1369
-
コーパスベース音声合成 閉ループ学習に基づく音声素片辞書の生成
赤嶺政巳, 篭嶋岳彦
日本音響学会研究発表会講演論文集 1999 1999年
ISSN: 1340-3168
-
モーラを単位としたアクセント規則の自動構築
森田真弘, 瀬戸重宣, 篭嶋岳彦, 赤嶺政巳
日本音響学会研究発表会講演論文集 1998 1998年
ISSN: 1340-3168
-
DSP組み込み可能な省メモリ音声合成方式
新居孝章, 瀬戸重宣, 赤嶺政巳
日本音響学会研究発表会講演論文集 1998 1998年
ISSN: 1340-3168
-
適応パルス位置代数符号帳を用いたCELP音声符号化
天田皇, 三関公生, 赤嶺政巳
日本音響学会研究発表会講演論文集 1998 1998年
ISSN: 1340-3168
-
ベクトル量子化に基づいた音声合成素片辞書の符号化
土谷勝美, 篭嶋岳彦, 赤嶺政巳
日本音響学会研究発表会講演論文集 1998 1998年
ISSN: 1340-3168
-
代表パターンコードブックを用いたピッチパターン制御法
篭嶋岳彦, 瀬戸重宣, 森田真弘, 赤嶺政巳
日本音響学会研究発表会講演論文集 1998 1998年
ISSN: 1340-3168
-
スペクトルの変動に着目した有音/無音判定法と可変レート音声コーデックへの適用
押切正浩, 赤嶺政巳
日本音響学会研究発表会講演論文集 1997 (Spring Pt 1) 1997年
ISSN: 1340-3168
-
ピッチ周期の補間ベクトル量子化を用いた可変レート音声符号化
押切正浩, 赤嶺政巳
日本音響学会研究発表会講演論文集 1997 1997年
ISSN: 1340-3168
-
閉ループ学習による音声素片の自動生成 最適な素片の解析的生成
篭嶋岳彦, 赤嶺政巳
日本音響学会研究発表会講演論文集 1997 1997年
ISSN: 1340-3168
-
閉ループ学習による音声素片の自動生成 代表素片選択
篭嶋岳彦, 赤嶺政巳
日本音響学会研究発表会講演論文集 1997 1997年
ISSN: 1340-3168
-
ピッチパターンを用いたCELP音声符号化方式
天田皇, 赤嶺政巳
日本音響学会研究発表会講演論文集 1997 1997年
ISSN: 1340-3168
-
高音質LPC分析残差駆動合成器
赤嶺政巳, 篭嶋岳彦, 土谷勝美
情報処理学会研究報告 97 (66(SLP-17)) 1997年
ISSN: 0919-6072
-
東芝の音声認識・合成ソフトウエアの紹介
松浦博, 正井康之, 原義幸, 新田恒雄, 赤嶺政巳, 瀬戸重宣, 太田治徳, 鈴木孝子, 小林賢一郎
情報処理学会研究報告 97 (66(SLP-17)) 1997年
ISSN: 0919-6072
-
高音質規則音声合成器のための有声音源生成法
篭嶋岳彦, 赤嶺政巳
日本音響学会研究発表会講演論文集 1996 (Spring Pt 1) 1996年
ISSN: 1340-3168
-
4kbps ADP-CELP音声符号化方式の低演算量化に関する検討
天田皇, 赤嶺政巳, 三関公生
日本音響学会研究発表会講演論文集 1996 (Spring Pt 1) 1996年
ISSN: 1340-3168
-
Binary-Modulated Vector Quantizationを用いた音声符号化
三関公生, 天田皇, 押切正浩, 赤嶺政巳
日本音響学会研究発表会講演論文集 1995 (Autumn Pt 1) 1995年
ISSN: 1340-3168
-
非直交化探索法を用いたCELP音声符号化方式
天田皇, 三関公生, 赤嶺政巳
日本音響学会研究発表会講演論文集 1995 (Spring Pt 1) 1995年
ISSN: 1340-3168
-
CELP音声符号化方式における多段符号帳の非直交化探索法
天田皇, 赤嶺政巳, 三関公生
電子情報通信学会技術研究報告 94 (372(SP94 53-62)) 1994年
ISSN: 0913-5685
-
相補直交化による基底変換を用いた音声符号化の一検討
三関公生, 赤嶺政巳, 天田皇, 押切正浩
電子情報通信学会大会講演論文集 1994 (Shuki Pt 1) 1994年
ISSN: 1349-1369
-
有声部/無声部に適した適応符号帳を持つCELP符号化方式
押切正浩, 赤嶺政巳, 三関公生
電子情報通信学会大会講演論文集 1994 (Shuki Pt 1) 1994年
ISSN: 1349-1369
-
音声符号化方式における符号帳の非直交化探索法
天田皇, 三関公生, 赤嶺政巳
電子情報通信学会大会講演論文集 1994 (Shuki Pt 1) 1994年
ISSN: 1349-1369
-
3.75kb/s ADP-CELP方式
三関公生, 赤嶺政巳, 押切正浩
電子情報通信学会技術研究報告 93 (156(SP93 44-48)) 1993年
ISSN: 0913-5685
-
PARCOR-LSPハイブリッド型LPC係数量子化法
押切正浩, 赤嶺政巳, 三関公生
電子情報通信学会技術研究報告 93 (156(SP93 44-48)) 1993年
ISSN: 0913-5685
-
極零合成フィルタ-駆動信号間適応ビット配分低レート音声符号化方式
三関公生, 赤嶺政巳
電子情報通信学会全国大会講演論文集 1991 (Spring Pt 1) 1991年
-
サブバンド符号化方式に基づくATM用可変レート音声符号化方式
吉川英隆, 赤嶺政巳, 三関公生, 工藤憲昌
電子情報通信学会全国大会講演論文集 1990 (Spring Pt.3) 1990年
-
算術符号化を用いた適応KL変換符号化方式
菊池義浩, 塚原由利子, 赤嶺政巳
電子情報通信学会全国大会講演論文集 1990 (Spring Pt.7) 1990年
-
サブバンド符号化方式に基づくATM用可変レート符号化方式
吉川英隆, 赤嶺政巳, 三関公生, 工藤憲昌
電子情報通信学会技術研究報告 89 (385(CS89 92-99)) 1990年
ISSN: 0913-5685
-
ADP-CELP符号化方式のDSPによる実現の検討
奥田裕二, 赤嶺政巳, 三関公生, 吉田博則
電子情報通信学会全国大会講演論文集 1990 (Spring Pt.1) 1990年
-
ADP-CELP方式におけるパラメータの符号誤り感度
神庭進, 三関公生, 赤嶺政巳
電子情報通信学会全国大会講演論文集 1990 (Spring Pt.1) 1990年
-
4.8kbps ADP-CELP 音声コーデックの開発
佐藤恭子, 渡辺栄一, 赤嶺政巳, 三関公生
電子情報通信学会全国大会講演論文集 1990 (Autumn Pt 3) 1990年
-
適応KL変換符号化方式における変換選択方法の検討
塚原由利子, 赤嶺政巳, 大関和夫
電子情報通信学会全国大会講演論文集 1990 (Autumn Pt 6) 1990年
-
ARMAモデルと適応密度パルス列モデルに基づく音声符号化方式
赤嶺政巳, 三関公生
電子情報通信学会全国大会講演論文集 1989 (Spring Pt.1) 1989年
-
適応密度パルス列モデルに基づくCELP符号化方式
赤嶺政巳, 三関公生
電子情報通信学会全国大会講演論文集 1989 (Autumn Pt.1) 1989年
-
高速DCT演算器の丸め誤差の理論解析
菊池義浩, 赤嶺政巳
電子情報通信学会全国大会講演論文集 1989 (Autumn Pt.6) 1989年
-
適応ビット配分を有する適応KL変換符号化方式
赤嶺政巳, 塚原由利子, 大関和夫
電子情報通信学会全国大会講演論文集 1989 (Autumn Pt.6) 1989年
-
適応型補正フィルタを用いたマルチパルス符号化方式の品質改善
三関公生, 赤嶺政巳
電子情報通信学会全国大会講演論文集 1989 (Autumn Pt.1) 1989年
-
逆スペクトルに基づく音声のARMA分析合成系の品質評価
赤嶺政巳, 三関公生
電子情報通信学会技術研究報告 87 (347) 1988年
ISSN: 0913-5685
-
音声のARMA分析における推定精度の向上
赤嶺政巳, 三関公生
電子情報通信学会全国大会講演論文集 1988 (Pt. A-1) 1988年
-
ARMAモデルを用いた8kbps音声符号化方式の検討
赤嶺政巳
電子情報通信学会全国大会講演論文集 1988 (Autumn Pt. A-1) 1988年
-
適応型補正フィルタを用いたマルチパルス駆動信号の効率的表現
三関公生, 赤嶺政巳
電子情報通信学会技術研究報告 88 (214) 1988年
ISSN: 0913-5685
-
適応型補正フィルタを用いたマルチパルス符号化方式
三関公生, 赤嶺政巳
電子情報通信学会全国大会講演論文集 1988 (Autumn Pt. A-1) 1988年
-
逆スペクトルと自己相関法に基づく音声のARMA分析法の検討
赤嶺政巳
電子情報通信学会技術研究報告 87 (306) 1987年
ISSN: 0913-5685
産業財産権 20
-
対話システム、対話装置、対話方法、及びプログラム
岩田 憲治, 藤村 浩司, 小林 優佳, 吉田 尚水, 赤嶺 政巳
特許第7132090号
産業財産権の種類: 特許権
-
対話システム、方法、及びプログラム
吉田 尚水, 岩田 憲治, 小林 優佳, 赤嶺 政巳
特許第7035239号
産業財産権の種類: 特許権
-
対話システム、対話方法および対話プログラム
赤嶺 政巳, 吉田 尚水
特許第6805112号
産業財産権の種類: 特許権
-
対話フロー制御装置、対話フロー制御方法およびプログラム
下郡 祐美子, 永江 尚義, 岩田 憲治, 赤嶺 政巳
特許第6553007号
産業財産権の種類: 特許権
-
音声合成方法、装置及びプログラム
赤嶺 政巳, ラトーレ・マルティネス・ハビエル, ワン・ビンセント・ピン・ルン, チン・カン・クホン, ゲールズ・マーク・ジョン・フランシス, ニル・キャサリン・マリー, チュン・ビュン・ハ
特許第6246777号
産業財産権の種類: 特許権
-
テキスト読み上げシステム
赤嶺 政巳, ラトーレ・マルティネス・ハビエル, ワン・ビンセント・ピン・ルン, チン・カン・クホン, ゲールズ・マーク・ジョン・フランシス, ニル・キャサリン・マリー
特許第6092293号
産業財産権の種類: 特許権
-
テキスト音声合成方法及びシステム
赤嶺 政巳, ラトーレ・マルティネス・ハビエル, ワン・ビンセント・ピン・ルン, チン・カン・クホン, ゲールズ・マーク・ジョン・フランシス, ニル・キャサリン・マリー, チュン・ビュン・ハ
特許第5847917号
産業財産権の種類: 特許権
-
音声処理システム
赤嶺 政巳, ランジョウ・チェン, マーク・ジョン・フランクルズ・ゲールズ, キャサリン・メリー・ニル
特許第5768093号
産業財産権の種類: 特許権
-
テキスト音声合成方法及びシステム
赤嶺 政巳, ラトーレ・マルティネス・ハビエル, ワン・ビンセント・ピン・ルン, チン・カン・クホン, ゲールズ・マーク・ジョン・フランシス, ニル・キャサリン・マリー, チュン・ビュン・ハ
特許第5659258号
産業財産権の種類: 特許権
-
音声モデル生成装置、音声合成装置、音声モデル生成プログラム、音声合成プログラム、音声モデル生成方法および音声合成方法
ラトレ ハビエル, 赤嶺 政巳
特許第5457706号
産業財産権の種類: 特許権
-
対話システム、方法、及びプログラム
吉田 尚水, 岩田 憲治, 小林 優佳, 赤嶺 政巳
産業財産権の種類: 特許権
-
対話システム、対話装置、対話方法、及びプログラム
岩田 憲治, 藤村 浩司, 小林 優佳, 吉田 尚水, 赤嶺 政巳
産業財産権の種類: 特許権
-
対話システム、対話方法および対話プログラム
赤嶺 政巳, 吉田 尚水
産業財産権の種類: 特許権
-
対話システム、方法、及びプログラム
吉田 尚水, 岩田 憲治, 小林 優佳, 赤嶺 政巳
産業財産権の種類: 特許権
-
対話フロー制御装置、対話フロー制御方法およびプログラム
下郡 祐美子, 永江 尚義, 岩田 憲治, 赤嶺 政巳
産業財産権の種類: 特許権
-
音声合成方法、装置及びプログラム
赤嶺 政巳, ラトーレ・マルティネス・ハビエル, ワン・ビンセント・ピン・ルン, チン・カン・クホン, ゲールズ・マーク・ジョン・フランシス, ニル・キャサリン・マリー, チュン・ビュン・ハ
産業財産権の種類: 特許権
-
音声処理システム
赤嶺 政巳, ランジョウ・チェン, マーク・ジョン・フランクルズ・ゲールズ, キャサリン・メリー・ニル
産業財産権の種類: 特許権
-
テキスト読み上げシステム
赤嶺 政巳, ラトーレ・マルティネス・ハビエル, ワン・ビンセント・ピン・ルン, チン・カン・クホン, ゲールズ・マーク・ジョン・フランシス, ニル・キャサリン・マリー
産業財産権の種類: 特許権
-
テキスト音声合成方法及びシステム
赤嶺 政巳, ラトーレ・マルティネス・ハビエル, ワン・ビンセント・ピン・ルン, チン・カン・クホン, ゲールズ・マーク・ジョン・フランシス, ニル・キャサリン・マリー, チュン・ビュン・ハ
産業財産権の種類: 特許権
-
音声処理システム
赤嶺 政巳, ランジョウ・チェン, マーク・ジョン・フランクルズ・ゲールズ, キャサリン・メリー・ニル
産業財産権の種類: 特許権
学術貢献活動 13
-
電子情報通信学会論文査読委員
1997年4月 ~ 継続中
-
IEEE論文査読委員
2007年1月 ~ 2023年12月
-
IEEE Speech and Language Technical Committeeメンバー
2018年1月 ~ 2020年12月
-
Asia-Pacific Signal and Information Processing Association Industrial membership Committeeメンバー
2016年4月 ~ 2019年12月
-
ISCA Industrial Liaison Committee委員
2010年1月 ~ 2019年12月
-
IEEE Spoken Language Technology Workshop (SLT), Organizing Committeeメンバー
2018年1月 ~ 2018年12月
-
ISCA主催国際会議 (Interspeech 2008、2010、2012、2013、2014、2015、2018)
2008年1月 ~ 2018年12月
-
IEEE Automatic Speech Recognition and Understanding Workshop (ASRU) 2017, Organizing Committeeメンバー
2017年4月 ~ 2017年12月
-
IEEE主催国際会議 (ICASSP 2012、2013、2014)セッションチェアー
2012年1月 ~ 2014年12月
-
IEEE Speech and Language Technical Committeeメンバー
2012年1月 ~ 2013年12月
-
IEEE CHiME-2013 ボードメンバー
2013年1月 ~ 2013年6月
-
ISCA Speech Synthesis Workshop (SSW7)プログラム委員
2010年1月 ~ 2010年12月
-
電子情報通信学会論文誌特集号編集委員
1997年1月 ~ 1997年12月