ترميز زوج البايتات
ترميز زوجين من البايت (بالإنجليزية: Byte Pair Encoding) هو نموذج بسيط لضغط البيانات يقوم بستبدال زوجين من البايت على التوالي وأكثرهما شيوعاً ببايت واحد بحيث لا يتكرر البايت المستبدل في مجموعة البيانات.[1][2] الزواج المستبدل يوضع في جدول لكي يتم إعادة بناء البيانات الأصلية.
مثال
لنفترض أننا نريد لترميز البيانات التالية:
aaabaaabac
زوجان aa يتكرران في معظم الأحيان لذلك سوف يتم استبداله بالبايت Z والذي لم يظهر في البيانات. والآن نضع البايت Z في جدول استبدال.
Z <- aa
ويعاد ترميز البيانات نحو التالي:
ZabZabac
بعد ترميز البيانات يظهر الزوجين Za بشكل مستمر لذلك سوف يتم استبدال بايت Y
Z <- aa Y <- Za
YbYbac
مرة أخرى نستبدال الزوجين الأكثر شيوعاً.
Z <- aa Y <- Za X <- Yb W <- XX
Wac
حتي نصل إلى مرحلة يستحيل ضغط البيانات بسبب عدم وجود أزواج من البايتات متكرره.
مراجع
- "Dr Dobbs Journal"، مؤرشف من الأصل في 14 ديسمبر 2019.
- "Byte Pair Encoding"، مؤرشف من الأصل في 17 فبراير 2017.
- بوابة تقانة
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.