હેલો!
"બ્રેડ શરીરને ફીડ કરે છે, અને પુસ્તક મનને ફીડ કરે છે" ...
પુસ્તકો - આધુનિક માણસની સૌથી કિંમતી સંપત્તિ પૈકીની એક. પુસ્તકો પ્રાચીન સમયમાં દેખાયા અને ખૂબ ખર્ચાળ હતા (એક પુસ્તક ગાયના ટોળા માટે વિનિમય થઈ શકે છે!). આધુનિક વિશ્વમાં, પુસ્તકો દરેક માટે ઉપલબ્ધ છે! તેમને વાંચીને, આપણે વધુ શિક્ષિત, વિકાસશીલ ક્ષિતિજ, ચાતુર્ય બની ગયા. અને સામાન્ય રીતે, તેઓએ હજી સુધી એક બીજાને પ્રસારિત કરવા માટે જ્ઞાનનો વધુ સંપૂર્ણ સ્રોત શોધ્યો નથી!
કમ્પ્યુટર તકનીકના વિકાસ (ખાસ કરીને છેલ્લા 10 વર્ષોમાં), તે ફક્ત પુસ્તકો વાંચવાનું જ નહીં, પણ તેમને સાંભળવા માટે શક્ય બન્યું છે (એટલે કે, તમે તેમને કોઈ વિશેષ પ્રોગ્રામમાં પુરૂષ અથવા સ્ત્રી વૉઇસમાં વાંચશો). હું તમને વૉઇસ ઍક્ટિંગ ટેક્સ્ટ માટે સૉફ્ટવેર સાધનો વિશે જણાવવા માંગું છું.
સામગ્રી
- લેખન સાથે સંભવિત સમસ્યાઓ
- સ્પીચ એન્જિન્સ
- અવાજ દ્વારા લખાણ વાંચવા માટે કાર્યક્રમો
- આઇવોના રીડર
- બાલબોલ્કા
- આઇસીઈ બુક રીડર
- વાચક
- સક્રામેન્ટ ટોકર
લેખન સાથે સંભવિત સમસ્યાઓ
પ્રોગ્રામ્સની સૂચિ પર જવા પહેલાં, હું સામાન્ય સમસ્યા પર ધ્યાન આપું છું અને જ્યારે કોઈ પ્રોગ્રામ ટેક્સ્ટ વાંચી શકતો નથી ત્યારે કેસને ધ્યાનમાં લે છે.
હકીકત એ છે કે વૉઇસ એન્જિન્સ છે, તે વિવિધ ધોરણો હોઈ શકે છે: એસએપીઆઇ 4, એસએપીઆઇ 5 અથવા માઇક્રોસોફ્ટ સ્પીચ પ્લેટફોર્મ (ટેક્સ્ટ રમવા માટેના મોટાભાગના કાર્યક્રમોમાં, આ સાધનની પસંદગી છે). તેથી, તે લોજિકલ છે કે વૉઇસ સાથે વાંચવા માટે પ્રોગ્રામ ઉપરાંત, તમારે એક એન્જિનની જરૂર છે (તે તેના પર નિર્ભર રહેશે, તમે કઈ ભાષામાં વાંચો છો, કઈ અવાજમાં: પુરૂષ અથવા સ્ત્રી, વગેરે).
સ્પીચ એન્જિન્સ
એન્જિનો મફત અને વ્યવસાયિક હોઈ શકે છે (અલબત્ત, ધ્વનિ પ્રજનનની શ્રેષ્ઠ ગુણવત્તા વાણિજ્યિક એન્જિનો દ્વારા પ્રદાન કરવામાં આવે છે).
SAPI 4. સાધનોની લેગસી આવૃત્તિઓ. આધુનિક પીસી માટે જૂની આવૃત્તિઓનો ઉપયોગ કરવાની ભલામણ કરવામાં આવતી નથી. એસએપીઆઇ 5 અથવા માઇક્રોસોફ્ટ સ્પીચ પ્લેટફોર્મને જોવાનું વધુ સારું છે.
એસએપીઆઈ 5. આધુનિક ભાષણ એન્જિનો, બંને મફત અને ચૂકવણી કરેલા છે. ઇન્ટરનેટ પર, તમે ડીએનપી 5 ડઝનેક સ્પીચ એન્જિન શોધી શકો છો (સ્ત્રી અને પુરુષ બંને અવાજો સાથે).
માઇક્રોસોફ્ટ સ્પીચ પ્લેટફોર્મ એ ટૂલ્સનો સમૂહ છે જે વિવિધ એપ્લિકેશંસના વિકાસકર્તાઓને ટેક્સ્ટને વૉઇસમાં રૂપાંતરિત કરવાની ક્ષમતાને અમલમાં મૂકવાની મંજૂરી આપે છે.
સ્પીચ સિન્થેસાઇઝર માટે કામ કરવા માટે, તમારે ઇન્સ્ટોલ કરવાની જરૂર છે:
- માઇક્રોસોફ્ટ સ્પીચ પ્લેટફોર્મ - રનટાઇમ - પ્લેટફોર્મની સર્વર બાજુ, પ્રોગ્રામ્સ માટે API પૂરી પાડે છે (x86_SpeechPlatformRuntime SpeechPlatformRuntime.msi ફાઇલ).
- માઇક્રોસોફ્ટ સ્પીચ પ્લેટફોર્મ - રનટાઇમ ભાષાઓ - સર્વર બાજુ માટેની ભાષાઓ. હાલમાં 26 ભાષાઓ છે. માર્ગ દ્વારા, રશિયન પણ છે - એલેનાની વૉઇસ (ફાઇલનું નામ "MSSpeech_TTS_" થી શરૂ થાય છે ...).
અવાજ દ્વારા લખાણ વાંચવા માટે કાર્યક્રમો
આઇવોના રીડર
વેબસાઇટ: ivona.com
ટેક્સ્ટની ધ્વનિ માટેનો એક શ્રેષ્ઠ પ્રોગ્રામ છે. તમારા પીસીને txt ફોર્મેટમાં ફક્ત સાદા ફાઇલોને વાંચવાની મંજૂરી આપતી નથી, પણ સમાચાર, આરએસએસ, ઇન્ટરનેટ પરના કોઈપણ વેબ પૃષ્ઠો, ઈ-મેલ, વગેરે.
આ ઉપરાંત, તે તમને ટેક્સ્ટને એક એમપી 3 ફાઇલમાં રૂપાંતરિત કરવા દે છે (જે પછી તમે કોઈપણ ફોન અથવા એમપી 3 પ્લેયર પર ડાઉનલોડ કરી શકો છો અને જવા માટે સાંભળી શકો છો). એટલે તમે ઑડિઓ પુસ્તકો જાતે બનાવી શકો છો!
આઇવૉના પ્રોગ્રામની અવાજો વાસ્તવિક લોકોની સમાન હોય છે, ઉચ્ચાર એટલા ખરાબ નથી, તેઓ ફટકો પડતા નથી. માર્ગ દ્વારા, વિદેશી ભાષાનો અભ્યાસ કરનાર લોકો માટે આ પ્રોગ્રામ ઉપયોગી થઈ શકે છે. તેના માટે આભાર, તમે તે અથવા અન્ય શબ્દોની યોગ્ય ઉચ્ચાર સાંભળી શકો છો.
તે SAPI5 ને સપોર્ટ કરે છે, ઉપરાંત તે બાહ્ય એપ્લિકેશંસ (ઉદાહરણ તરીકે, એપલ ઇટ્યુન્સ, સ્કાયપે) સાથે સારી રીતે સહકાર આપે છે.
ઉદાહરણ (મારા તાજેતરના લેખમાંથી એક લખો)
માઇન્યુસમાંથી: કેટલાક અજાણ્યા શબ્દો અયોગ્ય ઉચ્ચાર અને છાપ સાથે વાંચવામાં આવે છે. સામાન્ય રીતે, સાંભળવા માટે પૂરતું ખરાબ નથી, ઉદાહરણ તરીકે, જ્યારે તમે કોઈ વ્યાખ્યાન / પાઠ પર જાઓ છો ત્યારે ઇતિહાસ પુસ્તકમાંથી ફકરો - તે કરતાં પણ વધુ!
બાલબોલ્કા
વેબસાઇટ: ક્રોસ-plus-a.ru/balabolka.html
- કાર્યક્રમ "બાલબોલ્કા" મુખ્યત્વે મોટેથી ટેક્સ્ટ ફાઇલો વાંચવા માટે બનાવાયેલ છે. રમવા માટે, તમારે પ્રોગ્રામ ઉપરાંત વૉઇસ એન્જિન્સ (સ્પીચ સિન્થેસાઇઝર) ની જરૂર છે.
સ્પીચ પ્લેબેકને માનક બટનોનો ઉપયોગ કરીને નિયંત્રિત કરી શકાય છે, જે કોઈપણ મલ્ટિમીડિયા પ્રોગ્રામ ("પ્લે / થોભો / રોકો") માં મળેલી સમાન છે.
પ્લેબેક ઉદાહરણ (સમાન)
વિપક્ષ: કેટલાક અજાણ્યા શબ્દો ખોટી રીતે વાંચે છે: તાણ, નિવારણ. કેટલીકવાર, તે વિરામચિહ્નોને અવગણે છે અને શબ્દો વચ્ચે થોભતું નથી. પરંતુ સામાન્ય રીતે, તમે સાંભળી શકો છો.
આ રીતે, અવાજ ગુણવત્તા, ભાષણ એન્જિન પર આધાર રાખે છે, તેથી, સમાન પ્રોગ્રામમાં, પ્લેબેક અવાજ નોંધપાત્ર રીતે અલગ હોઈ શકે છે!
આઇસીઈ બુક રીડર
વેબસાઇટ: આઇસ-ગ્રાફિક્સ / ICEReader / IndexR.html
પુસ્તકો સાથે કામ કરવા માટે ઉત્તમ પ્રોગ્રામ: વાંચવું, સૂચિબદ્ધ કરવું, શોધવું વગેરે. સ્ટાન્ડર્ડ ડોક્યુમેન્ટ્સ ઉપરાંત, જે અન્ય પ્રોગ્રામ્સ (TXT-HTML, HTML-TXT, TXT-DOC, DOC-TXT, PDB-TXT, LIT-TXT દ્વારા વાંચી શકાય છે) ઉપરાંત વાંચી શકાય છે. , એફબી 2-ટીએક્સટી, વગેરે) આઇસીઈ બુક રીડર ફાઇલ ફોર્મેટ્સને સપોર્ટ કરે છે: એલઆઈટી, .CHM અને. EPub.
આ ઉપરાંત, આઇસીઈ બુક રીડર ફક્ત વાંચવા માટે જ નહીં, પણ ઉત્તમ ડેસ્કટૉપ લાઇબ્રેરી પણ આપે છે:
- તમને પુસ્તકો સંગ્રહિત કરવા, પ્રક્રિયા કરવા, સૂચિબદ્ધ કરવાની મંજૂરી આપે છે (250 મિલિયન નકલો સુધી!);
- તમારા સંગ્રહની આપમેળે ઓર્ડરિંગ;
- તમારા "ડમ્પ" માંથી પુસ્તકની ઝડપી શોધ (ખાસ કરીને જો તમારી પાસે અસંખ્ય બિન-સૂચિબદ્ધ સાહિત્ય હોય તો);
- આઇસીઈ બુક રીડર ડેટાબેઝ એન્જિન આ પ્રકારના મોટાભાગના પ્રોગ્રામ્સથી વધુ શ્રેષ્ઠ છે.
પ્રોગ્રામ તમને વૉઇસ દ્વારા ટેક્સ્ટ્સ અવાજ કરવાની મંજૂરી આપે છે.
આ કરવા માટે, પ્રોગ્રામ સેટિંગ્સ પર જાઓ અને બે ટૅબ્સને ગોઠવો: "મોડ" (વૉઇસ દ્વારા વાંચવાનું પસંદ કરો) અને "ભાષણ સંશ્લેષણ મોડ" (ભાષણ એંજિન પસંદ કરો).
વાચક
વેબસાઇટ: વેક્ટર-ski.ru/vecs/govorilka/index.htm
કાર્યક્રમ "ટોકર" ની મુખ્ય લાક્ષણિકતાઓ:
- વૉઇસ દ્વારા ટેક્સ્ટ વાંચવું (દસ્તાવેજો txt, ડૉક, RTF, HTML, વગેરે ખોલે છે);
- તમને સ્પીડમાં ફોર્મેટ (* .WAV, * .m3) માંથી ટેક્સ્ટ રેકોર્ડ કરવાની ઝડપ વધારવાની મંજૂરી આપે છે - દા.ત. આવશ્યક રૂપે ઇલેક્ટ્રોનિક ઑડિઓ બુક બનાવવું;
- સારી વાંચી ઝડપ નિયંત્રણ કાર્યો;
- ઓટો સ્ક્રોલ;
- શબ્દભંડોળ ફરીથી ભરવાની ક્ષમતા;
- DOS સમયમાં જૂની ફાઇલોને સપોર્ટ કરે છે (ઘણા આધુનિક પ્રોગ્રામ્સ આ એન્કોડિંગમાં ફાઇલો વાંચી શકતા નથી);
- ફાઇલ કદ જેમાંથી પ્રોગ્રામ ટેક્સ્ટ વાંચી શકે છે: 2 ગીગાબાઇટ્સ સુધી;
- બુકમાર્ક્સ બનાવવા માટેની ક્ષમતા: જ્યારે તમે પ્રોગ્રામથી બહાર નીકળો છો, ત્યારે તે આપમેળે તે સ્થાને યાદ કરે છે જ્યાં કર્સર રોકે છે.
સક્રામેન્ટ ટોકર
વેબસાઇટ: sakrament.by/index.html
સાક્રામેન્ટ ટોકર સાથે, તમે તમારા કમ્પ્યુટરને વાર્તાલાપ ઑડિઓ બુકમાં ફેરવી શકો છો! સક્રામેંટ ટૉકર પ્રોગ્રામ આરટીએફ અને ટીએક્સટી બંધારણોને સપોર્ટ કરે છે, તે ફાઇલના એન્કોડિંગને આપમેળે ઓળખી શકે છે (સંભવતઃ, કેટલીકવાર તે નોંધ્યું હતું કે કેટલાક પ્રોગ્રામ્સ ટેક્સ્ટને બદલે "ક્રાયોસ્કોક્સ" સાથે ફાઇલ ખોલે છે, તેથી આ સક્રામેન્ટ ટોકરમાં શક્ય નથી!).
આ ઉપરાંત, સક્રામેંટ ટૉકર તમને મોટી પર્યાપ્ત ફાઇલોને ચલાવવાની પરવાનગી આપે છે, ઝડપથી કેટલીક ફાઇલોને શોધો. તમે ફક્ત તમારા કમ્પ્યુટર પર વૉઇસ કરેલ ટેક્સ્ટ જ સાંભળી શકતા નથી, પણ તેને એક એમપી 3 ફાઇલ તરીકે પણ સાચવી શકો છો (જે પછીથી કોઈપણ પ્લેયર અથવા ફોન પર કૉપિ કરી શકાય છે અને પીસીથી સાંભળ્યું છે).
સામાન્ય રીતે, તે એક સારો પ્રોગ્રામ છે જે બધા લોકપ્રિય વૉઇસ એન્જિન્સને સપોર્ટ કરે છે.
આજે તે બધું જ છે. આજના પ્રોગ્રામ્સ હજી સુધી સંપૂર્ણ રીતે (100% ગુણાત્મક રૂપે) ટેક્સ્ટ વાંચી શકતા નથી, જેથી કોઈ વ્યક્તિ તેને કોણ વાંચી શકે તે નિર્ધારિત કરી શકે નહીં: કોઈ પ્રોગ્રામ અથવા કોઈ વ્યક્તિ ... પરંતુ મને લાગે છે કે કેટલીકવાર પ્રોગ્રામ્સ આના પર આવશે: કમ્પ્યુટર પાવર વૃદ્ધિ પામે છે, એન્જિન વોલ્યુમમાં વધે છે (વધુને વધુ નવા અને સૌથી વધુ જટિલ ભાષણ વળે છે) - જેનો અર્થ એ થાય કે પ્રોગ્રામમાંથી અવાજ જેટલો જલ્દી પૂરતો હશે તે સામાન્ય માનવીય ભાષણથી અસ્પષ્ટ હશે ?! vv
સારી નોકરી છે!