東北大学研究者紹介

研究者詳細

ホーム

日本語 English

アカミネ　マサミ

赤嶺　政巳

Masami Akamine

所属

高等大学院機構　高等大学院機構・学位プログラム推進センター

職名

教授

学位

工学博士（東北大学）
工学修士（東北大学）

researchmap

https://researchmap.jp/makamine

J-GLOBAL ID

202601017025397134

e-Rad 研究者番号

91034700

経歴 14

2025年11月～継続中

東北大学　高等大学院機構　教授
2019年4月～ 2025年10月

東北大学　大学院工学研究科　特任教授
2018年4月～ 2019年3月

東芝研究開発センター・メディアAIラボラトリー　シニアフェロー
2016年4月～ 2019年3月

慶應義塾大学理工学研究科　非常勤特任教授
2015年4月～ 2018年3月

東芝リサーチ・コンサルティング　シニアフェロー
2005年4月～ 2015年3月

東芝研究開発センター　技監
2004年4月～ 2005年3月

東芝研究開発センター・特別研究室　研究主幹
2002年4月～ 2004年3月

東芝研究開発センター　研究企画室グループ長
2000年4月～ 2002年3月

東芝研究開発センター・マルチメディアラボラトリー　室長
2000年4月～ 2001年3月

和歌山大学大学院システム工学研究科　非常勤講師
1997年4月～ 2000年3月

東芝研究開発センター・関西研究所　ラボリーダー
1994年4月～ 1997年3月

東芝研究開発センター・情報通信システム研究所　主任研究員
1989年4月～ 1994年3月

東芝研究開発センター・情報通信システム研究所　研究主務
1985年4月～ 1989年3月

東芝総合研究所(平成4年から研究開発センターに改名)・電子機器研究所　研究員

︎全件表示 ︎最初の5件までを表示

学歴 2

東北大学　大学院工学研究科博士後期課程電子工学専攻

1982年4月～ 1985年3月
東北大学　大学院工学研究科博士前期課程情報工学専攻

1980年4月～ 1982年3月

所属学協会 4

電子情報通信学会名誉員

2022年6月～継続中
APSIPA (Asia Pacific Signal and Information Processing Association)

2008年1月～継続中
ISCA (International Speech Communication Association)

2003年1月～継続中
IEEE

1984年1月～ 2023年12月

研究キーワード 6

機械学習
ディジタル信号処理
音声対話
音声符号化
音声認識
音声合成

研究分野 1

情報通信 / ヒューマンインタフェース、インタラクション / 音声処理

受賞 10

功績賞

2020年6月　電子情報通信学会
紫綬褒章

2013年4月　内閣府
業績賞

2012年5月　電子情報通信学会
全国発明表彰内閣総理大臣発明賞

2008年6月　発明協会
連作論文賞

2003年9月　電子情報通信学会
市村産業賞功績賞

2003年4月　新技術開発財団
技術開発賞

2002年5月　日本音響学会
文部科学大臣賞研究功績者

2001年4月　文部科学省
テレコムシステム技術賞

2001年3月　電気通信普及財団
篠原記念学術奨励賞

1989年3月　電子情報通信学会

︎全件表示 ︎最初の5件までを表示

論文 60

Dialog State Tracking for Unseen Values Using an Extended Attention Mechanism

Takami Yoshida, Kenji Iwata, Hiroshi Fujimura, Masami Akamine

9TH INTERNATIONAL WORKSHOP ON SPOKEN DIALOGUE SYSTEM TECHNOLOGY　579　77-89　2019年

DOI： 10.1007/978-981-13-9443-0_7 　

ISSN：1876-1100

eISSN：1876-1119
OUT-OF-DOMAIN SLOT VALUE DETECTION FOR SPOKEN DIALOGUE SYSTEMS WITH CONTEXT INFORMATION

Yuka Kobayashi, Takami Yoshida, Kenji Iwata, Hiroshi Fujimura, Masami Akamine

2018 IEEE WORKSHOP ON SPOKEN LANGUAGE TECHNOLOGY (SLT 2018)　854-861　2018年

ISSN：2639-5479
Near and Far Field Speech-in-Noise Intelligibility Improvements Based on a Time-Frequency Energy Reallocation Approach

Tudor-Catalin Zorila, Yannis Stylianou, Tatsuma Ishihara, Masami Akamine

IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING　24　(10)　1808-1818　2016年10月

DOI： 10.1109/TASLP.2016.2585864 　

ISSN：2329-9290

eISSN：2329-9304
Statistical Bandwidth Extension for Speech Synthesis Based on Gaussian Mixture Model with Sub-Band Basis Spectrum Model

Yamato Ohtani, Masatsune Tamura, Masahiro Morita, Masami Akamine

IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS　E99D　(10)　2481-2489　2016年10月

DOI： 10.1587/transinf.2016SLP0006 　

ISSN：1745-1361
Voice Activity Detection: Merging Source and Filter-based Information

Thomas Drugman, Yannis Stylianou, Yusuke Kida, Masami Akamine

IEEE SIGNAL PROCESSING LETTERS　23　(2)　252-256　2016年2月

DOI： 10.1109/LSP.2015.2495219 　

ISSN：1070-9908

eISSN：1558-2361
Emotional transplant in statistical speech synthesis based on emotion additive model

Yaniato Ohtani, Yu Nasu, Masahiro Morita, Masami Akamine

16TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2015), VOLS 1-5　274-278　2015年
A Maximum Likelihood Approach to the Detection of Moments of Maximum Excitation and its Application to High-Quality Speech Parameterization

Ranniery Maia, Yannis Stylianou, Masami Akamine

16TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2015), VOLS 1-5　603-607　2015年
On the impact of excitation and spectral parameters for expressive statistical parametric speech synthesis

Ranniery Maia, Masami Akamine

COMPUTER SPEECH AND LANGUAGE　28　(5)　1209-1232　2014年9月

DOI： 10.1016/j.csl.2013.10.001 　

ISSN：0885-2308

eISSN：1095-8363
Building HMM-TTS Voices on Diverse Data

Vincent Wan, Javier Latorre, Kayoko Yanagisawa, Norbert Braunschweiler, Langzhou Chen, Mark J. F. Gales, Masami Akamine

IEEE JOURNAL OF SELECTED TOPICS IN SIGNAL PROCESSING　8　(2)　296-306　2014年4月

DOI： 10.1109/JSTSP.2013.2295058 　

ISSN：1932-4553

eISSN：1941-0484
Integrated Expression Prediction and Speech Synthesis From Text

Langzhou Chen, Mark J. F. Gales, Norbert Braunschweiler, Masami Akamine, Kate Knill

IEEE JOURNAL OF SELECTED TOPICS IN SIGNAL PROCESSING　8　(2)　323-335　2014年4月

DOI： 10.1109/JSTSP.2013.2294938 　

ISSN：1932-4553

eISSN：1941-0484
Complex cepstrum for statistical parametric speech synthesis

Ranniery Maia, Masami Akamine, Mark J. F. Gales

SPEECH COMMUNICATION　55　(5)　606-618　2013年6月

DOI： 10.1016/j.specom.2012.12.008 　

ISSN：0167-6393

eISSN：1872-7182
Minimum mean squared error based warped complex cepstrum analysis for statistical parametric speech synthesis

Ranniery Maia, Mark J. F. Gales, Yannis Stylianou, Masami Akamine

14TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2013), VOLS 1-5　2335-2339　2013年

ISSN：2308-457X
Photo-Realistic Expressive Text to Talking Head Synthesis

Vincent Wan, Robert Anderson, Art Blokland, Norbert Braunschweiler, Langzhou Chen, BalaKrishna Kolluru, Javier Latorre, Ranniery Maia, Bjoern Stenger, Kayoko Yanagisawa, Yannis Stylianou, Masami Akamine, Mark J. F. Gales, Roberto Cipolla

14TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2013), VOLS 1-5　2666-2668　2013年

ISSN：2308-457X
TRAINING A SUPRA-SEGMENTAL PARAMETRIC F0 MODEL WITHOUT INTERPOLATING F0

Javier Latorre, Mark J. F. Gales, Kate Knill, Masami Akamine

2013 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP)　6880-6884　2013年

ISSN：1520-6149
COMPLEX CEPSTRUM ANALYSIS BASED ON THE MINIMUM MEAN SQUARED ERROR

Ranniery Maia, Masami Akamine, M. J. F. Gales

2013 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP)　7972-7976　2013年

ISSN：1520-6149
INTEGRATED AUTOMATIC EXPRESSION PREDICTION AND SPEECH SYNTHESIS FROM TEXT

Langzhou Chen, Mark J. F. Gales, Norbert Braunschweiler, Masami Akamine, Kate Knill

2013 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP)　7977-7981　2013年

ISSN：1520-6149
Decision tree-based acoustic models for speech recognition

Masami Akamine, Jitendra Ajmera

EURASIP JOURNAL ON AUDIO SPEECH AND MUSIC PROCESSING　2012年

DOI： 10.1186/1687-4722-2012-10 　

ISSN：1687-4722
COMPLEX CEPSTRUM AS PHASE INFORMATION IN STATISTICAL PARAMETRIC SPEECH SYNTHESIS

Ranniery Maia, Masami Akamine, M. J. F. Gales

2012 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP)　4581-4584　2012年

ISSN：1520-6149
Exploring Rich Expressive Information from Audiobook Data Using Cluster Adaptive Training

Langzhou Chen, Mark J. F. Gales, Vincent Wan, Javier Latorre, Masami Akamine

13TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2012 (INTERSPEECH 2012), VOLS 1-3　958-961　2012年
Speech factorization for HMM-TTS based on cluster adaptive training.

Javier Latorre, Vincent Wan, Mark J. F. Gales, Langzhou Chen, K. K. Chin, Kate Knill, Masami Akamine

13TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2012 (INTERSPEECH 2012), VOLS 1-3　970-973　2012年
Combining multiple high quality corpora for improving HMM-TTS

Vincent Wan, Javier Latorre, K. K. Chin, Langzhou Chen, Mark J. F. Gales, Heiga Zen, Kate Knill, Masami Akamine

13TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2012 (INTERSPEECH 2012), VOLS 1-3　1134-1137　2012年
Histogram-based spectral equalization for HMM-based speech synthesis using mel-LSP

Yamato Ohtani, Masatsune Tamura, Masahiro Morita, Takehiko Kagoshima, Masami Akamine

13TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2012 (INTERSPEECH 2012), VOLS 1-3　1154-1157　2012年
HMM-based speech synthesis using sub-band basis spectrum model

Yamato Ohtani, Masatsune Tamura, Masahiro Morita, Takehiko Kagoshima, Masami Akamine

13TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2012 (INTERSPEECH 2012), VOLS 1-3　1438-1441　2012年
Analysis on the Importance of Short-Term Speech Parameterizations for Emotional Statistical Parametric Speech Synthesis

Ranniery Maia, Masami Akamine

13TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2012 (INTERSPEECH 2012), VOLS 1-3　1630-1633　2012年
Decision Tree-Based Acoustic Models for Speech Recognition with Improved Smoothness

Masami Akamine, Jitendra Ajmera

IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS　E94D　(11)　2250-2258　2011年11月

DOI： 10.1587/transinf.E94.D.2250 　

ISSN：1745-1361
CONTINUOUS F0 IN THE SOURCE-EXCITATION GENERATION FOR HMM-BASED TTS: DO WE NEED VOICEDIUNVOICED CLASSIFICATION?

Javier Latorre, Mark J. F. Gales, Sabine Buchholz, Kate Knill, Masatsune Tamura, Yamato Ohtani, Masami Akamine

2011 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING　4724-4727　2011年

ISSN：1520-6149
ONE SENTENCE VOICE ADAPTATION USING GMM-BASED FREQUENCY-WARPING AND SHIFT WITH A SUB-BAND BASIS SPECTRUM MODEL

Masatsune Tamura, Masahiro Morita, Takehiko Kagoshima, Masami Akamine

2011 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING　5124-5127　2011年

ISSN：1520-6149
COVARIANCE CLUSTERING ON RIEMANNIAN MANIFOLDS FOR ACOUSTIC MODEL COMPRESSION

Yusuke Shinohara, Takashi Masuko, Masami Akamine

2010 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING　4326-4329　2010年

DOI： 10.1109/ICASSP.2010.5495661 　

ISSN：1520-6149
UNIT SELECTION SPEECH SYNTHESIS USING MULTIPLE SPEECH UNITS AT NON-ADJACENT SEGMENTS FOR PROSODY AND WAVEFORM GENERATION

Masatsune Tamura, Norbert Braunschweiler, Takehiko Kagoshima, Masami Akamine

2010 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING　4802-4805　2010年

DOI： 10.1109/ICASSP.2010.5495151 　

ISSN：1520-6149
Sub-band Basis Spectrum Model for Pitch-synchronous Log-spectrum and Phase Based on Approximation of Sparse Coding

Masatsune Tamura, Takehiko Kagoshima, Masami Akamine

11TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2010 (INTERSPEECH 2010), VOLS 3 AND 4　2406-2409　2010年
BAYESIAN FEATURE ENHANCEMENT USING A MIXTURE OF UNSCENTED TRANSFORMATIONS FOR UNCERTAINTY DECODING OF NOISY SPEECH

Yusuke Shinohara, Masami Akamine

2009 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOLS 1- 8, PROCEEDINGS　4569-4572　2009年

DOI： 10.1109/ICASSP.2009.4960647 　

ISSN：1520-6149
Decision Tree Acoustic Models for ASR

Jitendra Ajmera, Masami Akamine

INTERSPEECH 2009: 10TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2009, VOLS 1-5　1379-1382　2009年
Feedback Loop for Prosody Prediction in Concatenative Speech Synthesis.

Javier Latorre, Sergio Gracia, Masami Akamine

INTERSPEECH 2009: 10TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2009, VOLS 1-5　2027-2030　2009年
Speech Recognition using Soft Decision Trees

Jitendra Ajmera, Masami Akamine

INTERSPEECH 2008: 9TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2008, VOLS 1-5　940-943　2008年
Comparative Evaluation of Different Methods for Voice Activity Detection

Hongfei Ding, Koichi Yamamoto, Masami Akamine

INTERSPEECH 2008: 9TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2008, VOLS 1-5　107-110　2008年
Multilevel parametric-base F0 model for speech synthesis

Javier Latorre, Masami Akamine

INTERSPEECH 2008: 9TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2008, VOLS 1-5　2274-2277　2008年
Feature enhancement by speaker-normalized splice for robust speech recognition

Yusuke Shinohara, Takashi Masuko, Masami Akamine

2008 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING, VOLS 1-12　4881-4884　2008年

ISSN：1520-6149
HMM-based Speech Recognition Using Decision Trees Instead of GMMs

Remco Teunen, Masami Akamine

INTERSPEECH 2007: 8TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION, VOLS 1-4　617-620　2007年
閉ループ学習に基づく最適な音声素片の解析的生成

篭嶋岳彦, 赤嶺政巳

電子情報通信学会論文誌 D-2　J83-D-2　(6)　2000年

ISSN：0915-1923
Toshiba English Text-to-Speech System (TESS) 査読有り

C. K. Suh, T. Kagoshima, M. Morita, S. Seto, M. Akamine

Proc. Eurospeech99　2111-2114　1999年
CELP speech coding based on an adaptive pulse position codebook 査読有り

T. Amada, K. Miseki, M. Akamine

IEEE Proc. ICASSP99　13-16　1999年
Analytic Generation of Synthesis Units by Closed Loop Training for Totally Speaker Driven Text to Speech System (TOS Drive TTS) 査読有り

M. Akamine, T. Kagoshima

1927-1930　1998年
An F0 Contour Control Model for Totally Speaker Driven Text to Speech System 査読有り

T. Kagoshima, M. Morita, S. Seto, M. Akamine

IEEE Proc. ICSLP98　1975-1978　1998年
Automatic Rule Generation for Linguistic Features Analysis Using Inductive Learning Technique-Linguistic Features Analysis in TOS Drive TTS System 査読有り

S. Seto, M. Morita, T. Kagoshima, M. Akamine

IEEE Proc. ICSLP98　2031-2034　1998年
A 2.4 Kbps Variable Bit Rate ADP-CELP Speech Coder 査読有り

M. Oshikiri, M. Akamine

IEEE Proc. ICASSP　1　517-520　1998年
閉ループ学習に基づく代表素片選択による音声素片の自動生成

篭嶋岳彦, 赤嶺政巳

電子情報通信学会論文誌 D-2　J81-D-2　(9)　1998年

ISSN：0915-1923
2.4kbps可変レートADP-CELP音声符号化

押切正浩, 赤嶺政巳

電子情報通信学会論文誌 A　J81-A　(11)　1998年

ISSN：0913-5707
Automatic Generation of Speech Synthesis Units Based on Closed Loop Training 査読有り

T. Kagoshima, M. Akamine

IEEE Proc. ICASSP97　2　963-966　1997年
CELP音声符号化における目標ベクトルの直交化に基づいた励振符号帳の高速探索

天田皇, 赤嶺政巳, 三関公生

電子情報通信学会論文誌 A　79　(5)　1996年

ISSN：0913-5707
Adaptive Density Pulse Excitation for Low Bit Rate Speech Coding 査読有り

Masami Akamine, Kimio Miseki

IEICE Trans.　E78　(2)　199-207　1995年2月
Improvement of ADP-CELP Speech Coding at 4 Kbits/s 査読有り

M. Akamine, K. Miseki, M. Oshikiri

IEEE Proc. GLOBECOM　1869-1873　1991年
Efficient Excitation Model for Low Bit Rate Speech Coding

M. Akamine, K. Miseki

IEEE Proc. ISCAS　586-589　1991年
Adaptive Bit-Allocation between the Pole-Zero Synthesis Filter and Excitation in CELP 査読有り

K. Miseki, M. Akamine

229-232　1991年
DCTを用いた画像符号化における完全再生可能なDCT演算精度

菊池義池, 赤嶺政巳

電子情報通信学会論文誌 A　74　(7)　1991年

ISSN：0913-5707
CELP Coding with an Adaptive Density Pulse Excitation Model

M. Akamine, K. Miseki

IEEE Proc. ICASSP　29-32　1990年
ARMA Model Based Speech Coding at 8 kb/s 査読有り

M. Akamine, K. Miseki

IEEE Proc. ICASSP　148-151　1989年
浮動小数点演算を用いたリミットサイクルのない演算誤差最小ディジタルフィルタのクラスについて

赤嶺政巳, 樋口龍雄

電子情報通信学会論文誌 A　70　(5)　1987年

ISSN：0913-5707
State-Space Approach to Synthesis of Minimum Quantization Error Digital Filter Using Floating-Point Arithmetic 査読有り

M. Akamine, T. Higuchi

IEEE Proc. ISCAS　3　1002-1005　1984年3月
浮動小数点演算を用いた量子化誤差最小ディジタルフィルタの合成査読有り

赤嶺政巳, 樋口龍雄

電子情報通信学会論文誌 A　66　(10)　895-902　1983年10月
浮動小数点演算を用いたディジタルフィルタの状態方程式に基づく量子化誤差解析査読有り

樋口龍雄, 赤嶺政巳

電子情報通信学会論文誌 A　66　(3)　186-193　1983年3月

︎全件表示 ︎最初の5件までを表示

MISC 68

遠隔マイクで集音した音声の認識精度を向上させる残響抑圧技術

籠嶋岳彦, KIM Uihyun, 赤嶺政巳

東芝レビュー(Web)　73　(5)　2018年

ISSN： 2432-1168
平静音声から予測した感情付与モデルに基づく統計的感情音声合成

大谷大和, 那須悠, 森田眞弘, 赤嶺政巳

日本音響学会研究発表会講演論文集(CD-ROM)　2015　2015年

ISSN： 1880-7658
サブバンド基底スペクトルモデルを利用した統計的帯域拡張法

大谷大和, 田村正統, 森田眞弘, 赤嶺政巳

電子情報通信学会技術研究報告　114　(52(SP2014 1-45))　2014年

ISSN： 0913-5685
表情豊かな音声と顔画像を合成するシステムXpressiveTalkの開発

森中亮, 那須悠, 田村正統, WAN Vincenty, 柳澤佳代子, STENGER Bjorn, 森田眞弘, 籠嶋岳彦, 赤嶺政巳

日本音響学会研究発表会講演論文集(CD-ROM)　2014　2014年

ISSN： 1880-7658
サブバンド基底スペクトルモデルを用いたGMMに基づく帯域拡張

大谷大和, 田村正統, 森田眞弘, 赤嶺政巳

日本音響学会研究発表会講演論文集(CD-ROM)　2014　2014年

ISSN： 1880-7658
HMM音声合成における加算モデルに基づく任意話者への感情付与法の検討

大谷大和, 那須悠, 森中亮, 田村正統, 森田眞弘, 赤嶺政巳

日本音響学会研究発表会講演論文集(CD-ROM)　2014　2014年

ISSN： 1880-7658
HMMに基づく感情音声合成のための共有感情付与モデル

大谷大和, 那須悠, 森中亮, 田村正統, 森田眞弘, 赤嶺政巳

電子情報通信学会技術研究報告　114　(303(SP2014 90-105))　2014年

ISSN： 0913-5685
サブバンド基底スペクトルモデルを用いたHMM音声合成

大谷大和, 田村正統, 森田眞弘, 籠嶋岳彦, 赤嶺政巳

日本音響学会研究発表会講演論文集(CD-ROM)　2013　2013年

ISSN： 1880-7658
身近になった音声処理技術と東芝の取組み

赤嶺政巳

東芝レビュー　68　(9)　2013年

ISSN： 0372-0462
東芝の音声合成技術-閉ループ学習から最近の取り組みまで-

赤嶺政巳

電子情報通信学会技術研究報告　113　(366(SP2013 82-95))　2013年

ISSN： 0913-5685
HMM音声合成による英語音声合成システムの開発

田村正統, KRSTULOVIC Sacha, 森中亮, 徳田龍太郎, 全炳河, 森田眞弘, 籠嶋岳彦, 赤嶺政巳

日本音響学会研究発表会講演論文集(CD-ROM)　2011　2011年

ISSN： 1880-7658
リーマン幾何学に基づく共分散クラスタリングによる音響モデルの圧縮

篠原雄介, 益子貴史, 赤嶺政巳

日本音響学会研究発表会講演論文集(CD-ROM)　2010　2010年

ISSN： 1880-7658
耐雑音音声認識のためのアンセンテッド変換を用いた特徴強調法

篠原雄介, 赤嶺政巳

日本音響学会研究発表会講演論文集(CD-ROM)　2009　2009年

ISSN： 1880-7658
雑音にロバストな音声と非音声の判別技術

山本幸一, 赤嶺政巳

東芝レビュー　64　(12)　2009年

ISSN： 0372-0462
閉ループ学習に基づく音声素片および基本周波数制御規則の生成

篭智岳彦, 赤嶺政巳, 瀬戸重宣, 森田真弘, 志賀芳則

電子情報通信学会技術研究報告　103　(632(SP2003 170-174))　2004年

ISSN： 0913-5685
FWFモデルを用いたピッチ波形の閉ループ学習

篭嶋岳彦, 赤嶺政巳

日本音響学会研究発表会講演論文集　2003　2003年

ISSN： 1340-3168
スペクトル包絡を制御するためのピッチ波形のモデリング

篭嶋岳彦, 赤嶺政巳

日本音響学会研究発表会講演論文集　2003　2003年

ISSN： 1340-3168
コンパクトなテキスト音声合成システムの開発

清水勇詞, 瀬戸重宣, 篭嶋岳彦, 赤嶺政巳

日本音響学会研究発表会講演論文集　2002　2002年

ISSN： 1340-3168
TOS-Drive TTSの米・英・独・仏・中国語への応用

平林剛, 森田真弘, 徳田龍太郎, 篭嶋岳彦, 赤嶺政巳

日本音響学会研究発表会講演論文集　2002　2002年

ISSN： 1340-3168
合成辞書作成に用いる音声DBの品質が合成音声に与える影響について

瀬戸重宣, 篭嶋岳彦, 土谷勝美, 赤嶺政巳

日本音響学会研究発表会講演論文集　2002　2002年

ISSN： 1340-3168
サブバンド閉ループ学習による音声素片の生成

篭嶋岳彦, 赤嶺政巳

日本音響学会研究発表会講演論文集　2002　2002年

ISSN： 1340-3168
音素HMMを環境適応的に選択して用いた競合モデルによる環境雑音のリジェクション

小柴亮典, 酒井優, 天田皇, 河村聡典, 正井康之, 赤嶺政巳

日本音響学会研究発表会講演論文集　2002　2002年

ISSN： 1340-3168
代表パターンコードブックを用いた基本周波数制御法

篭嶋岳彦, 森田真弘, 瀬戸重宣, 赤嶺政巳, 志賀芳則

電子情報通信学会論文誌 D-2　J85-D-2　(6)　2002年

ISSN： 0915-1923
多言語音声認識エンジンの開発

出口豊, 金沢博史, 赤嶺政巳

日本音響学会研究発表会講演論文集　2002　2002年

ISSN： 1340-3168
ITS(高度道路交通システム) 車載マルチメディア

前田賢一, 赤嶺政巳, 加瀬直樹

東芝レビュー　55　(1)　2000年

ISSN： 0372-0462
東芝パソコンの音声認識/合成ソフトウェア

正井康之, 桃崎浩平, 松浦博, 田中信一, 鈴木孝子, 赤嶺政巳, 山中紀子, 原義幸

電子情報通信学会大会講演論文集　2000　2000年

ISSN： 1349-1369
コーパスベース音声合成閉ループ学習に基づく音声素片辞書の生成

赤嶺政巳, 篭嶋岳彦

日本音響学会研究発表会講演論文集　1999　1999年

ISSN： 1340-3168
モーラを単位としたアクセント規則の自動構築

森田真弘, 瀬戸重宣, 篭嶋岳彦, 赤嶺政巳

日本音響学会研究発表会講演論文集　1998　1998年

ISSN： 1340-3168
DSP組み込み可能な省メモリ音声合成方式

新居孝章, 瀬戸重宣, 赤嶺政巳

日本音響学会研究発表会講演論文集　1998　1998年

ISSN： 1340-3168
適応パルス位置代数符号帳を用いたCELP音声符号化

天田皇, 三関公生, 赤嶺政巳

日本音響学会研究発表会講演論文集　1998　1998年

ISSN： 1340-3168
ベクトル量子化に基づいた音声合成素片辞書の符号化

土谷勝美, 篭嶋岳彦, 赤嶺政巳

日本音響学会研究発表会講演論文集　1998　1998年

ISSN： 1340-3168
代表パターンコードブックを用いたピッチパターン制御法

篭嶋岳彦, 瀬戸重宣, 森田真弘, 赤嶺政巳

日本音響学会研究発表会講演論文集　1998　1998年

ISSN： 1340-3168
スペクトルの変動に着目した有音/無音判定法と可変レート音声コーデックへの適用

押切正浩, 赤嶺政巳

日本音響学会研究発表会講演論文集　1997　(Spring Pt 1)　1997年

ISSN： 1340-3168
ピッチ周期の補間ベクトル量子化を用いた可変レート音声符号化

押切正浩, 赤嶺政巳

日本音響学会研究発表会講演論文集　1997　1997年

ISSN： 1340-3168
閉ループ学習による音声素片の自動生成最適な素片の解析的生成

篭嶋岳彦, 赤嶺政巳

日本音響学会研究発表会講演論文集　1997　1997年

ISSN： 1340-3168
閉ループ学習による音声素片の自動生成代表素片選択

篭嶋岳彦, 赤嶺政巳

日本音響学会研究発表会講演論文集　1997　1997年

ISSN： 1340-3168
ピッチパターンを用いたCELP音声符号化方式

天田皇, 赤嶺政巳

日本音響学会研究発表会講演論文集　1997　1997年

ISSN： 1340-3168
高音質LPC分析残差駆動合成器

赤嶺政巳, 篭嶋岳彦, 土谷勝美

情報処理学会研究報告　97　(66(SLP-17))　1997年

ISSN： 0919-6072
東芝の音声認識・合成ソフトウエアの紹介

松浦博, 正井康之, 原義幸, 新田恒雄, 赤嶺政巳, 瀬戸重宣, 太田治徳, 鈴木孝子, 小林賢一郎

情報処理学会研究報告　97　(66(SLP-17))　1997年

ISSN： 0919-6072
高音質規則音声合成器のための有声音源生成法

篭嶋岳彦, 赤嶺政巳

日本音響学会研究発表会講演論文集　1996　(Spring Pt 1)　1996年

ISSN： 1340-3168
4kbps ADP-CELP音声符号化方式の低演算量化に関する検討

天田皇, 赤嶺政巳, 三関公生

日本音響学会研究発表会講演論文集　1996　(Spring Pt 1)　1996年

ISSN： 1340-3168
Binary-Modulated Vector Quantizationを用いた音声符号化

三関公生, 天田皇, 押切正浩, 赤嶺政巳

日本音響学会研究発表会講演論文集　1995　(Autumn Pt 1)　1995年

ISSN： 1340-3168
非直交化探索法を用いたCELP音声符号化方式

天田皇, 三関公生, 赤嶺政巳

日本音響学会研究発表会講演論文集　1995　(Spring Pt 1)　1995年

ISSN： 1340-3168
CELP音声符号化方式における多段符号帳の非直交化探索法

天田皇, 赤嶺政巳, 三関公生

電子情報通信学会技術研究報告　94　(372(SP94 53-62))　1994年

ISSN： 0913-5685
相補直交化による基底変換を用いた音声符号化の一検討

三関公生, 赤嶺政巳, 天田皇, 押切正浩

電子情報通信学会大会講演論文集　1994　(Shuki Pt 1)　1994年

ISSN： 1349-1369
有声部/無声部に適した適応符号帳を持つCELP符号化方式

押切正浩, 赤嶺政巳, 三関公生

電子情報通信学会大会講演論文集　1994　(Shuki Pt 1)　1994年

ISSN： 1349-1369
音声符号化方式における符号帳の非直交化探索法

天田皇, 三関公生, 赤嶺政巳

電子情報通信学会大会講演論文集　1994　(Shuki Pt 1)　1994年

ISSN： 1349-1369
3.75kb/s ADP-CELP方式

三関公生, 赤嶺政巳, 押切正浩

電子情報通信学会技術研究報告　93　(156(SP93 44-48))　1993年

ISSN： 0913-5685
PARCOR-LSPハイブリッド型LPC係数量子化法

押切正浩, 赤嶺政巳, 三関公生

電子情報通信学会技術研究報告　93　(156(SP93 44-48))　1993年

ISSN： 0913-5685
極零合成フィルタ-駆動信号間適応ビット配分低レート音声符号化方式

三関公生, 赤嶺政巳

電子情報通信学会全国大会講演論文集　1991　(Spring Pt 1)　1991年
サブバンド符号化方式に基づくATM用可変レート音声符号化方式

吉川英隆, 赤嶺政巳, 三関公生, 工藤憲昌

電子情報通信学会全国大会講演論文集　1990　(Spring Pt.3)　1990年
算術符号化を用いた適応KL変換符号化方式

菊池義浩, 塚原由利子, 赤嶺政巳

電子情報通信学会全国大会講演論文集　1990　(Spring Pt.7)　1990年
サブバンド符号化方式に基づくATM用可変レート符号化方式

吉川英隆, 赤嶺政巳, 三関公生, 工藤憲昌

電子情報通信学会技術研究報告　89　(385(CS89 92-99))　1990年

ISSN： 0913-5685
ADP-CELP符号化方式のDSPによる実現の検討

奥田裕二, 赤嶺政巳, 三関公生, 吉田博則

電子情報通信学会全国大会講演論文集　1990　(Spring Pt.1)　1990年
ADP-CELP方式におけるパラメータの符号誤り感度

神庭進, 三関公生, 赤嶺政巳

電子情報通信学会全国大会講演論文集　1990　(Spring Pt.1)　1990年
4.8kbps ADP-CELP 音声コーデックの開発

佐藤恭子, 渡辺栄一, 赤嶺政巳, 三関公生

電子情報通信学会全国大会講演論文集　1990　(Autumn Pt 3)　1990年
適応KL変換符号化方式における変換選択方法の検討

塚原由利子, 赤嶺政巳, 大関和夫

電子情報通信学会全国大会講演論文集　1990　(Autumn Pt 6)　1990年
ARMAモデルと適応密度パルス列モデルに基づく音声符号化方式

赤嶺政巳, 三関公生

電子情報通信学会全国大会講演論文集　1989　(Spring Pt.1)　1989年
適応密度パルス列モデルに基づくCELP符号化方式

赤嶺政巳, 三関公生

電子情報通信学会全国大会講演論文集　1989　(Autumn Pt.1)　1989年
高速DCT演算器の丸め誤差の理論解析

菊池義浩, 赤嶺政巳

電子情報通信学会全国大会講演論文集　1989　(Autumn Pt.6)　1989年
適応ビット配分を有する適応KL変換符号化方式

赤嶺政巳, 塚原由利子, 大関和夫

電子情報通信学会全国大会講演論文集　1989　(Autumn Pt.6)　1989年
適応型補正フィルタを用いたマルチパルス符号化方式の品質改善

三関公生, 赤嶺政巳

電子情報通信学会全国大会講演論文集　1989　(Autumn Pt.1)　1989年
逆スペクトルに基づく音声のARMA分析合成系の品質評価

赤嶺政巳, 三関公生

電子情報通信学会技術研究報告　87　(347)　1988年

ISSN： 0913-5685
音声のARMA分析における推定精度の向上

赤嶺政巳, 三関公生

電子情報通信学会全国大会講演論文集　1988　(Pt. A-1)　1988年
ARMAモデルを用いた8kbps音声符号化方式の検討

赤嶺政巳

電子情報通信学会全国大会講演論文集　1988　(Autumn Pt. A-1)　1988年
適応型補正フィルタを用いたマルチパルス駆動信号の効率的表現

三関公生, 赤嶺政巳

電子情報通信学会技術研究報告　88　(214)　1988年

ISSN： 0913-5685
適応型補正フィルタを用いたマルチパルス符号化方式

三関公生, 赤嶺政巳

電子情報通信学会全国大会講演論文集　1988　(Autumn Pt. A-1)　1988年
逆スペクトルと自己相関法に基づく音声のARMA分析法の検討

赤嶺政巳

電子情報通信学会技術研究報告　87　(306)　1987年

ISSN： 0913-5685

︎全件表示 ︎最初の5件までを表示

産業財産権 20

対話システム、対話装置、対話方法、及びプログラム

岩田憲治, 藤村浩司, 小林優佳, 吉田尚水, 赤嶺政巳

特許第7132090号

産業財産権の種類: 特許権
対話システム、方法、及びプログラム

吉田尚水, 岩田憲治, 小林優佳, 赤嶺政巳

特許第7035239号

産業財産権の種類: 特許権
対話システム、対話方法および対話プログラム

赤嶺政巳, 吉田尚水

特許第6805112号

産業財産権の種類: 特許権
対話フロー制御装置、対話フロー制御方法およびプログラム

下郡祐美子, 永江尚義, 岩田憲治, 赤嶺政巳

特許第6553007号

産業財産権の種類: 特許権
音声合成方法、装置及びプログラム

赤嶺政巳, ラトーレ・マルティネス・ハビエル, ワン・ビンセント・ピン・ルン, チン・カン・クホン, ゲールズ・マーク・ジョン・フランシス, ニル・キャサリン・マリー, チュン・ビュン・ハ

特許第6246777号

産業財産権の種類: 特許権
テキスト読み上げシステム

赤嶺政巳, ラトーレ・マルティネス・ハビエル, ワン・ビンセント・ピン・ルン, チン・カン・クホン, ゲールズ・マーク・ジョン・フランシス, ニル・キャサリン・マリー

特許第6092293号

産業財産権の種類: 特許権
テキスト音声合成方法及びシステム

赤嶺政巳, ラトーレ・マルティネス・ハビエル, ワン・ビンセント・ピン・ルン, チン・カン・クホン, ゲールズ・マーク・ジョン・フランシス, ニル・キャサリン・マリー, チュン・ビュン・ハ

特許第5847917号

産業財産権の種類: 特許権
音声処理システム

赤嶺政巳, ランジョウ・チェン, マーク・ジョン・フランクルズ・ゲールズ, キャサリン・メリー・ニル

特許第5768093号

産業財産権の種類: 特許権
テキスト音声合成方法及びシステム

赤嶺政巳, ラトーレ・マルティネス・ハビエル, ワン・ビンセント・ピン・ルン, チン・カン・クホン, ゲールズ・マーク・ジョン・フランシス, ニル・キャサリン・マリー, チュン・ビュン・ハ

特許第5659258号

産業財産権の種類: 特許権
音声モデル生成装置、音声合成装置、音声モデル生成プログラム、音声合成プログラム、音声モデル生成方法および音声合成方法

ラトレハビエル, 赤嶺政巳

特許第5457706号

産業財産権の種類: 特許権
対話システム、方法、及びプログラム

吉田尚水, 岩田憲治, 小林優佳, 赤嶺政巳

産業財産権の種類: 特許権
対話システム、対話装置、対話方法、及びプログラム

岩田憲治, 藤村浩司, 小林優佳, 吉田尚水, 赤嶺政巳

産業財産権の種類: 特許権
対話システム、対話方法および対話プログラム

赤嶺政巳, 吉田尚水

産業財産権の種類: 特許権
対話システム、方法、及びプログラム

吉田尚水, 岩田憲治, 小林優佳, 赤嶺政巳

産業財産権の種類: 特許権
対話フロー制御装置、対話フロー制御方法およびプログラム

下郡祐美子, 永江尚義, 岩田憲治, 赤嶺政巳

産業財産権の種類: 特許権
音声合成方法、装置及びプログラム

赤嶺政巳, ラトーレ・マルティネス・ハビエル, ワン・ビンセント・ピン・ルン, チン・カン・クホン, ゲールズ・マーク・ジョン・フランシス, ニル・キャサリン・マリー, チュン・ビュン・ハ

産業財産権の種類: 特許権
音声処理システム

赤嶺政巳, ランジョウ・チェン, マーク・ジョン・フランクルズ・ゲールズ, キャサリン・メリー・ニル

産業財産権の種類: 特許権
テキスト読み上げシステム

赤嶺政巳, ラトーレ・マルティネス・ハビエル, ワン・ビンセント・ピン・ルン, チン・カン・クホン, ゲールズ・マーク・ジョン・フランシス, ニル・キャサリン・マリー

産業財産権の種類: 特許権
テキスト音声合成方法及びシステム

赤嶺政巳, ラトーレ・マルティネス・ハビエル, ワン・ビンセント・ピン・ルン, チン・カン・クホン, ゲールズ・マーク・ジョン・フランシス, ニル・キャサリン・マリー, チュン・ビュン・ハ

産業財産権の種類: 特許権
音声処理システム

赤嶺政巳, ランジョウ・チェン, マーク・ジョン・フランクルズ・ゲールズ, キャサリン・メリー・ニル

産業財産権の種類: 特許権

︎全件表示 ︎最初の5件までを表示

学術貢献活動 13

電子情報通信学会論文査読委員

1997年4月～継続中
IEEE論文査読委員

2007年1月～ 2023年12月
IEEE Speech and Language Technical Committeeメンバー

2018年1月～ 2020年12月
Asia-Pacific Signal and Information Processing Association Industrial membership Committeeメンバー

2016年4月～ 2019年12月
ISCA Industrial Liaison Committee委員

2010年1月～ 2019年12月
IEEE Spoken Language Technology Workshop (SLT), Organizing Committeeメンバー

2018年1月～ 2018年12月
ISCA主催国際会議 (Interspeech 2008、2010、2012、2013、2014、2015、2018)

2008年1月～ 2018年12月
IEEE Automatic Speech Recognition and Understanding Workshop (ASRU) 2017, Organizing Committeeメンバー

2017年4月～ 2017年12月
IEEE主催国際会議 (ICASSP 2012、2013、2014)セッションチェアー

2012年1月～ 2014年12月
IEEE Speech and Language Technical Committeeメンバー

2012年1月～ 2013年12月
IEEE CHiME-2013 ボードメンバー

2013年1月～ 2013年6月
ISCA Speech Synthesis Workshop (SSW7)プログラム委員

2010年1月～ 2010年12月
電子情報通信学会論文誌特集号編集委員

1997年1月～ 1997年12月

︎全件表示 ︎最初の5件までを表示