دستور العمل استاندارد فشرده سازی صوت و تصویر:
فقط یک دهه بعد از فهمیدن، سود لایه سوم صوتی MPEG به طور گسترده پذیرش شد.
تعداد کمی از ترانه ها و قطعه های موزیکی قابل دسترسی در اینترنت بودند و میلیونها نفر که قبلاً تجربه کردند که چگونه تکنولوژی فشرده سازی صوتی را عرضه کنند.
تعداد کمی از استفاده کنندگان مفهوم گذشته MPEG و متراکم سازی (فشرده سازی) صوتی را فهمیدند.
در این مقاله تلاش شده تا نظرها و عقیده ها نشان و توضیح داده شوند.
داستانی از صوت MPEG :
در اواخر سال 1980 نیاز برای یک استاندارد فشرده سازی صوتی واضح بود.
کیفیت صوتی CD – یک نمونه برداری فرکانس از 100/44 هرتز و 16 بیت هر نمونه است.
بیش از 600/705 بیت یا 220/88 بایت برای هر ثانیه از صوت ترجمه می شود.
با بیشتر ترانه هایی که سایز شان چندین دقیقه طول می کشد، سایز این فایلهای صوتی باز شده از ذخیره و انتقال آنها جلوگیری می کند.
در سال 1987 – انستیتوفرون هافر بر روی یک تکنولوژی به طور خاص برای حل این مشکل آغاز به کار کرد.
بعد ها گروه خبر تلاش کردند عکسی را حرکت دهند در نتیجه لایه ی اول صوت MPEG را ساختند.
این استاندارد فشرده سازی صوتی به داخل استاندارد MPEG برای تصویر و صوت ملحق شد.
از آن زمان امکاناتی برای صوت MPEG وجود دارد : مزیت MPEG2 کد گذاری صوتی می باشد.
(صوت MPEG4 – همچنین پسوندهایی از این فرمتها مثل 2.5 لایه MPEG وجود دارد و لایه سوم MPEG – این استاندارد های مختلف در بازده و راندمان خوب هستند و در پیچیدگی از الگوریتم فشرده سازی تفاوت دارند – آنها می توانند همه سطوح استثناء را فشرده کنند.
نظرهای قدیمی MPEG :
در گفته های متفاوت، مدل تولیدی از الگوهای عمومی طرح کلی در صوت وجود ندارد، بنابر این ارتباطات زیادی در فهمیدن روشهای کدگذاری کار آمد وجود دارد.
علمی که چگونگی دریافت صداها را برای بشر دارد.
در دوره هایی مثل فرکانس – سطح، شکل یا حالت طیفی و عمق نوسان صدا اغلب استفاده می شوند هنگامیکه صداها مطابق با اصول علمی توصیف می شوند.
اما همه اینها در این که درک نمی شوند مورد قبول هستند که فقط هنگامیکه صداها در معنی فیزیکی مورد بحث قرار می گیرند مفیدند.
مردم بیشتر نگران هستند برای قبول چیزهای مثل درجه – صدای کمتر – وضوح کمتر و قدرت نوسان و وجود دارد کلماتی که یک شخص خاص استفاده می کند برای صداهای توصیفی و اینها فشرده سازیهای مختلفی هستند که باعث می شود ما صداها را دریافت کنیم.
سیستم رسیدگی بشری می تواند به طور طرحی پیش نویس به عنوان یک وسیله کاوش فرکانسی که به طور خاص تنظیم شده با 25 با زاویه بحرانی توصیف شود.
به عبارت دیگر بشر فقط قادر است صداهایی را گوش کند که در یکی از این 25 رنج فرکانس باشد .
هیچ موج صدایی خارج از این رنجهایی که قابل شنیدن نیستند وجود ندارد فرکانس آنها بین 700 هرتز و 7000 هرتز کاهش پیدا می کند .
رفتار صوتی MPEG کاراکترهایی از شنیدن افراد به طور کار آمد برای متراکم شدن صوتی می باشد.
اولاً بدست آوردن زیادی از فشرده سازی بوسیله سیگنالهای صوتی حذف شده است که خارج از رنج فهم و درک بشر است .
به طور عمده صداها با فرکانس بالای 20000 هرتز هستند.
دوماً یک الگو برای صداهای حذف شده با رنج درک افراد وجود دارد.
اما قابل شنیدن نیستند و قبل از صداهای دیگر قرار می گیرد.
ترکیب این دو روش دست یافتن MPEG را ناپیدا می کند یا فشرده سازی را به طور دست یافتنی کمتر اتلاف می کند.
دو نمونه از ماسک وجود دارد: همزمان و ماسک زمانی.
در ماسک همزمان یک یا بیشتر سیگنالهای صدا به سطح پایین تسلط دارند.
به طور همزمان بر طبق سیگنالهایی با فرکانسهای مشابه است.
بنابر این همه ی ؟؟؟؟
سیگنالهای سطح پایین را گوش می کنند.
در ماسکهای زمانی یک سیگنال ماسک صداهای دیگر است که قبل و بعد از آن رخ می دهد.
این دو پدیده زمانی خارق العاده است که به عنوان پر ماسک و پست ماسک به طور خاصی اشاره شود.
در توضیح نظریه استفاده از فشرده سازی صوت MPEG اکنون امکانی برای توضیح دقیق است که چگونه از این نظریه ها استفاده شود.
با این وجود ، ابتدا باید ویژگی پر اتلافی از فشرده سازی شرح داده شود.
هنگامیکه سیگنالهای صوتی ضبط، دیجیتالی و سپس متراکم می شود صدا از یک حالت فیزیکی به یک بازنمایی باینری (دودویی) تبدیل می شود.
از تبدیل صداهایی که همیشه معرفی خواهد شد این پردازش به طور درونی پر اتلاف است.
یک سیگنال معمولی بعد از فشرده شدن نمی تواند تولید شود.
با این وجود ترمیم MPEG برای این با گرفتن یک سری از مراحلی است که محدود به اثراتی از این صداها است و برای نظریه های فوق الذکر قابل استفاده می باشد.
فشرده سازی صوت MPEG اول یک مدلیشن از ضربان PCM صوت ورودی می گیرد.
یک فرمت برای سیگنال صوت فشرده نشده و گذر از دو مدل مختلف.
اولین مدل یک زمان به فرکانس است که بانک فیلتر را باز نمایی می کند و در سیگنال به 32 ساب باند داخلی از رنجهای فرکانسی که به طور طرح پیش نویس درست می شود تقسیم می شود و همچنین برای زمان اصلی که زمان صحیح از سیگنالها است قابل امکان می باشد.
به عبارت دیگر دومین مدل ثابت از دو مدل فزی چوی کستیک که سر آغاز خاموش شدن سطح برای 32 ساب باند را محاسبه می کند.
مدلهای فزی چوی کستیک لازم به شمارش برای اختلاف بین درک بشر از آهنگ صدا و صداهای بی آهنگ هستند.
این مدلها در سیگنالهای تسلط یافته در ورودی تعیین خواهد شد و درایوی که باس آن در آستانه سکون است که سیگنالهای سمعی می باشد.
هیچ سیگنال کاهشی زیر محدودیت سر آغاز بی صدایی مطرح نشده و به صورت ماسک خواهد بود.
سیگنال معمولی به 32 ساب باند تقسیم می شود زیرا سیگنالهای مختلف اثرات مختلفی برای آغاز کار دارند.
در ابتدا رنجهای فرکانس بالاست و بعد آهسته و پایین می شود و در انتها بالاست.
از این دو مدل که فشرده سازی MPEG درایوهای الگوریتم است سیگنال ماسکی و سیگنال صدا برای هر ساب باند نسبتی است.
این اطلاعات برای تعیین اینکه چگونه بیتهای زیادی خارج از دسترس هستند استفاده می شود و برای هر ساب باند که باید چگونگی ادامه یافتن و کیفیت صوتی آن تخصیص داده شود به طور معمولی بیشتر بیتها با دقت بیشتر تخصیص داده می شود و تولید صوتی آن کامل است.
یکی از این محاسبه های کامل آخرین باقی مانده این مرحله که رنج نمونه صوتی داخل چارچوب فرمت درست شده می باشد.
استفاده از کد هافمن سیگنالهای صوتی رمزی هستند و با بیتهای تخصیص داده شده ذخیره می شود.
سپس جای آن در یک چهارچوب خاص از فرمت متراکم شدن قرار می گیرد.
بیشتر فرمهای صوتی MPEG شامل یک گرداننده و یک چرخه برای چک کردن است.
اطلاعات درون سیگنال و بالای 152/1 نمونه از سیگنال صوتی است.
این فرمها به ترتیب درست می شوند و داخل فرمتهای رشته بیتی به صورت رمزی قرار می گیرند.
و نتیجه آن متراکم شدن فایل صوتی MPEG است.
از زمانیکه لایه سوم هست با دور شدن از فشرده سازی صوتی، تفاوت قبلیها دیگر ارزش ندارد.
در ابتدا از دو نوع مختلف از بانکهای فیلتر در گامهای اولیه از فشرده سازی استفاده می شود.
در مقایسه با زمان فرکانسی بانکهای فیلتر که بالایه ی اول و لایه ی سوم MPEG مورد استفاده قرار می گیرد باز نمایی می شود.
همچنین MP3 برای کسینوس گسسته تغییر یافته که بیشتر آن به 32 ساب باند تقسیم می شود استفاده می شود.
زمانیکه مجموعه این مراحل متراکم بودن را به طور کمپلکس افزایش داد کیفیت فایل متراکم صوتی را نیز افزایش می دهد.
دومین اختلاف ساپرتهای MP3 سازگار کردن سایز بلوک و پذیرش نام بیتهای ذخیره شده است.
به جای استفاده از دستور العمل فرمهای ثابت، فرمهای MP3 با پوینترها و سپس به دنبال آن فرمهایی از سایز متغیر مراجعه می شوند.
بنابر این اگر یک فرم ناقص شامل فقط نمونه سیگنال صوتی زیاد می شود و نیاز نباشد که همه بیتها از آن تخصیص داده شود، می تواند سیستمهای زیادی را به داخل یک منبع برای استفاده با نتیجه ی فرمها با پییچیدگی بیشتر سیگنالهای صوتی تخصیص دهد.
یک کامپیوتر شخصی به طور افزایشی قدرتمند است، MPEG با پیچیدگی بیشتری می تواند استفاده شود و الگوریتمهای قدرمتند بیشتری به نتیجه ی بهتری دست می یابند.
با این وجود، یک روند کاهشی در فشرده سازی صوتی برای متراکم شدن بیشتر وجود دارد.
در ابتدا تقاضای افزایش برای اثر متقابل بین موزیک و شنونده ها و جود دارد.
استفاده کننده ها اکنون می خواهند به ماشینی دوست داشتنی دسترسی پیدا کنند.
صوت MPEG-4 به بخشی از این روند با روند با ساپرت کردن روی خط پیوسته سازی منعکس می شود.
با این وجود هنوز کمبود ویژگی های زیادی برای مطمئن بودن اثر انتقال وجود دارد.
دوماً روند یافتن عقیده ای از موضوعات در صوت است در این اصل فقط یک موضوع شامل پارامترهایی از مدل صوتی ضبط شده خواهد بود.
سپس هنگامیکه فایلها در حالت نمایش قرار گرفتند، کامپیوترها از این الگوها از اطلاعاتی که نیاز است برای ترکیب شدن صوت معمولی بیرون یابی می شوند.
1) W.T.K , A.G.Davis , E.Ambikairaja موفق به این کارها شدند : ماسک شنوایی و MPEG1 و فشرده سازی صوتی – ژورنال مهندسی ارتباط الکترونیکی و Vo 19 در اگوست 1977.
2) نول، کیفیت صوتی بالا برای مولتی مدیا : تکنولوژیهای کی برد و استانداردهای MPEG اتصال داخلی یکپارچه برای سرویسهای دانشگاهی.
کنفرانس مخابرات تلفنی جهانی.
3) Davis pan : یک در سی روی فشرده سازی صوتی MPEG است.
مولتی مدیا IEEE است، Vol2 در تابستان 1955.
4) M.M candles ایجاد Mp3 سیستمهای این تل IEEE .
Vol.14,IEEE در ماه جان 1999.
5) B.Leslie and M.Sandler : فشرده سازی صوتی استفاده از امواج – مکالمه IEEE روی صوت و تکنولوژی موزیک : رقابت کرد در به وجود آوردن IEEE,DSP در لندن 1198.