ЯРИАНЫ ДОХИОН ДАХЬ ҮГИЙГ ҮЕЭР САЛГАХ ТУРШИЛТЫН ҮР ДҮН
Монгол хэл нь залгамал хэл учраас үг бүтэхдээ ихэвчлэн дагаврын аргаар бүтдэг. Тиймээс хэлэгдсэн үгийг үе болгон задлах аргыг судлах шаардлагатай байдаг. Энэхүү ажилдаа бид ярианы дохионоос үгийн үеийг ялган авах туршилтыг гүйцэтгэв.
Туршилтад 16бит, 44.1 kГц, нэг сувгаар бичигдсэн файлыг ашигласан. Үгээс үеийг ялгах процессыг эхлэхийн өмнө дохионы урьдчилсан боловсруулалтыг гүйцэтгэнэ. Урьдчилсан боловсруулалт нь ярианы дохионы нормчлол, pre-emphasis шүүлтүүр, фрейм, цонх тавих болон үгийн эхлэл, төгсгөлийг ялгах багтана [1]. Зураг 1-т “бүдэг” үгийн дохионы хэлбэрийг үзүүлэв.
Зураг 1. “Бүдэг” үгийн дохионы хэлбэр.
Урьдчилсан боловсруулалтын дараа ярианы дохионоос үеийг ялган авах процесс гүйцэтгэгдэнэ. Эхлээд доорх томьёог ашиглан дохионд хагас үеийн шулуутгагчийг хэрэглэнэ [2].
𝑦(𝑛)=𝑥(𝑛)∙(1+𝑠𝑖𝑔𝑛(𝑥(𝑛)))/2 (1)
Энд sign(x) нь
𝑠𝑖𝑔𝑛(𝑥)={−1,𝑥<00,𝑥=01,𝑥>0 (2)
Зураг 2-т хагас үеийн шулуутгагчийн үр дүнг үзүүлэв.
Зураг 2. Хагас үеийн шулуутгагчийн үр дүн
Үүний дараа дохионы оройг мэдрэхийн тулд шугаман бус шүүлтүүр буюу “envelope” мэдрэгчийг ашиглах [3] ба бид туршилтад 3-р эрэмбийн “butterfly” шүүлтүүрийг ашигласан. Үр дүнг зураг 3-т үзүүлэв.
Зураг 3. “Envelope” мэдрэгчийн үр дүн.
“Envelope” мэдрэгчийн үр дүнд үеийг ялгах боломжтой болох бөгөөд сигнал-шуугианы харьцаанаас хамаарч үеийн эхлэл [4], төгсгөлийг ялган авна (Зураг 4).
Зураг 4. Үеийг ялгасан үр дүн.
Хөх өнгөөр оролтын дохионы хэлбэрийг, улаан шугамаар үеийг ялгах хилийг зааж байна. Зураг 4-с харахад “бүдэг” үгийн 1-бү, 2-дэг гэсэн 2 үеийг амжилттай ялгасан байна. Программын кодыг MATLAB хэл дээр бичсэн.
Ашигласан материал:
1. Zandan.B., Odsuren.B., Alexandr G.C., Tuvdendorj G., "Speech Recognition in Mongolian Language using a Neural Network with pre-processing Technique", 2020 International Youth Conference on Radio Electronics, Electrical and Power Engineering (REEPE), Power Engineering Institute (MPEI), Moscow, 2020. https://ieeexplore.ieee.org/abstract/document/9059228
2. L. R. Rabiner and R. W. Schafer, “Introduction to Digital Speech Processing”, Now Publishers, 2007.
3. E.L.F. Da Silva, H.M. De Oliveira, “Implementation of an Automatic Syllabic Division Algorithm from Speech Files in Portuguese Language”, 2015.
4. L. Rabiner and B. H. Juang, “ Fundamentals of Speech Recognition”, Prentice-Hall, 2013.