データ構造とアルゴリズム実験‐(付加実験)テキスト列のハフマン符号化と復号化
48425 ワード
テキスト列のハフマン符号化と復号化
ハフマン符号化は最も基本的な文字圧縮符号化である.テキストをハフマン符号化してから情報通信を行うことで、チャネル利用率を大幅に向上させ、情報伝送時間を短縮し、伝送コストを低減することができる.しかしながら、これは、送信側で1つの符号化システムを介して伝送データを予め符号化することを要求する.受信側では、送信されたデータを復号(復元)する.プログラムを設計し、1行の文字列(最大長さ10000文字)を入力し、ハフマン符号化を構築してください.必要に応じて(転送前に)文字テキストを符号化(文字テキストをハフマン0-1符号化に変換)するか、符号化されたデータ(受信後)を復号(0-1符号化を文字テキストに復元)するかを選択します.具体的には、(1)初期化(I):1行のテキストを読み込み、文字分布に基づいてハフマンツリーを構築し、文字のハフマン符号化(符号化と復号化に用いる)を構築し、「Huffman code established!」を出力する.(2)符号化(C):得られたハフマン符号化を用いて元の文字テキストを符号化し、出力する.(3)デコード(D):符号化後の0-1テキストをデコード(元の文字テキストに復元)、出力;(4)退出(X):終了;注意:符号化または復号時にハフマン符号化が確立されていない場合は、ヒント「Huffman code does not exist!」例:サンプル入力:I Welcome to the school of computer science and technology.C D 1100110010010010010000010001010111011100100100100100000110111011101000001001001000001011001101111010001011111001001001011111001001011011010101110100100100100101110100100100110110010010110010010010011111111101010 Xサンプル出力:Huffman code established!11011011001100100001000101101110111001001011100001101110111010000001110010000101011001101111010001000101111100011100111000111110101011101000011101101101000000111011111000100111101101110001100000110100100001010011111011111101010 Welcome to the school of computer science and technology.
注意:stringはmallocできません.newを使います.stringはmallocできない、newを使う!stringはmallocできない、newを使う!そのため、codeblocks上で実行できます.OJ上ではだめです.2日間のセグメントエラーですね.ハフマンツリーを作成する方法:1.2つの重み値が最も小さい点(重み値が同じであれば前を選択)を見つけて、この2つの点を1つのルート(ルートの重み値は2つのポイントの重み値の和)に接続し、「ルート」を元のシーケンスの最後に配置します.選択した2つの点を元のシーケンスから削除します(元のシーケンスは重複文字を削除した後の所定のシーケンスを指します).2.元のシーケンスの残りの点がルートノードとしてマークされるまで、上記の操作を繰り返します.
スペースを含む文字列を入力します.
getchar();
char c;
scanf("%c",&c);
int i=0;
while(c!='
')
{
str[i]=c;
i++;
scanf("%c",&c);
}
len=i;
完全なコードは次のとおりです.
#pragma GCC optimize(3,"Ofast","inline")
#pragma G++ optimize(3)
#include
#include
#include
#include
#include
#include
#include
#include
#include
#include
#include
#include
#include
#include
#include
using namespace std;
typedef long long ll;
typedef unsigned long long ull;
typedef pair<ll,ll> pll;
typedef pair<int,int> pii;
typedef queue<int> q_i;
typedef queue<string> q_s;
typedef queue<double> q_d;
typedef queue<ll> q_ll;
typedef queue<char> q_c;
typedef priority_queue<int> pq_i;
typedef priority_queue<string> pq_s;
typedef priority_queue<double> pq_d;
typedef priority_queue<ll> pq_ll;
typedef stack<int> s_i;
typedef stack<string> s_s;
typedef stack<double> s_d;
typedef stack<ll> s_ll;
typedef stack<char> s_c;
typedef map<ll,ll> m_ll_ll;
typedef map<int,ll> m_i_ll;
typedef map<string,ll> m_s_ll;
typedef map<char,int> m_c_i;
typedef map<char,ll> m_c_ll;
#define rep(i,l,r) for(ll i=l;i<=r;i++)
#define per(i,l,r) for(ll i=r;i>=l;i--)
#define eif else if
#define N 3005
#define mm(dp) memset(dp,0,sizeof(dp))
#define mm1(dp) memset(dp,-1,sizeof(dp))
#define mm2(dp) memset(dp,0x3f,sizeof(dp))
#define IT set::iterator
#define fs(n) fixed<< setprecision(n)
#define inf 0x3f3f3f3f
const double e=2.71828182845;
const double pi = acos(-1.0);
map<char,int>mapp;
map<char,string>mapp1;
typedef struct
{
string s1;
int num;
}STU;
typedef struct
{
string s1,s0;
int num;
}STU1;
bool cmp(STU x,STU y)
{
return x.num>y.num;
}
typedef struct node
{
string data;
struct node *left,*right;
}HuffmanTreeNode,*PtrHuffman;
class Haffman
{
public:
PtrHuffman head=NULL;
PtrHuffman p[100005];
void create1(int nm,STU *stu)
{
int u=0;
rep(i,1,nm)
{
PtrHuffman t=new HuffmanTreeNode;
t->data = stu[i].s1;
t->left = t->right = NULL;
p[i]= t;
}
rep(i,1,nm-1)
{
int fi=inf,se=inf;
int fi1=0,se1=0;
rep(j,1,nm+u)
{
if(stu[j].num>0&&stu[j].num<fi)
{
fi=stu[j].num;
fi1=j;
}
}
rep(j,1,nm+u)
{
if(stu[j].num>0&&stu[j].num<se&&j!=fi1)
{
se=stu[j].num;
se1=j;
}
}
PtrHuffman q=new HuffmanTreeNode;
q->data=p[fi1]->data+p[se1]->data;
q->left=p[fi1];
q->right=p[se1];
u++;
stu[nm+u].s1=stu[fi1].s1+stu[se1].s1;
stu[nm+u].num=stu[fi1].num+stu[se1].num;
p[nm+u]=q;
stu[fi1].num=-1;
stu[se1].num=-1;
head=q;
}
}
void bianli(struct node *t1,int u)
{
if(t1==NULL)
return;
if(u==0)
cout<<t1->data<<endl;
else
{
cout<<u<<" ";
cout<<t1->data<<endl;
}
bianli(t1->left,u+1);
bianli(t1->right,u+1);
}
void bianli1(struct node *t1,char ch,string str)
{
if(t1==NULL)
return;
string s1="";
s1+=ch;
string ss=t1->data;
if(ss==s1)
{
mapp1[ch]=str;
return;
}
else
{
string s=t1->data;
int len=s.size();
int flag=0;
rep(i,0,len)
{
if(s[i]==ch)
{
flag=1;
break;
}
}
if(flag==0)
return;
else
{
bianli1(t1->left,ch,str+"0");
bianli1(t1->right,ch,str+"1");
}
}
}
STU1 bianli2(struct node *t1,string str)
{
if(t1->data.size()==1)
{
STU1 stu;
stu.s1=t1->data;
int len=str.size();
stu.s0=str;
return stu;
}
char ch=str[0];
int len=str.size();
str=str.substr(1,len-1);
if(ch=='0')
{
return bianli2(t1->left,str);
}
if(ch=='1')
{
return bianli2(t1->right,str);
}
}
};
int len;
int main()
{
//ios::sync_with_stdio(false);
//cin.tie(0);
//cout.tie(0);
Haffman ha;
char str[10005];
int uu=0;
while(1)
{
char ch;
cin>>ch;
if(ch=='X')
break;
eif(ch=='I')
{
getchar();
char c;
scanf("%c",&c);
int i=0;
while(c!='
')
{
str[i]=c;
i++;
scanf("%c",&c);
}
len=i;
string ss="";
rep(i,0,len-1)
{
if(mapp[str[i]]==0)
{
mapp[str[i]]=1;
ss+=str[i];
}
eif(mapp[str[i]]!=0)
{
mapp[str[i]]++;
}
}
int len1=ss.size();
STU stu[10005];
rep(i,0,len1-1)
{
string s0="";
char c=ss[i];
s0+=c;
stu[i+1].s1=s0;
stu[i+1].num=mapp[c];
}
ha.create1(len1,stu);
cout<<"Huffman code established!"<<endl;
uu=1;
}
eif(ch=='C')
{
if(uu==0)
{
cout<<"Huffman code does not exist!"<<endl;
}
else{
rep(i,0,len-1)
{
char cc=str[i];
ha.bianli1(ha.head,cc,"");
cout<<mapp1[str[i]];
}
cout<<endl;
}}
eif(ch=='D')
{
if(uu==0)
{
cout<<"Huffman code does not exist!"<<endl;
}
else{
string s2;
cin>>s2;
while(1)
{
if(s2=="")
break;
STU1 huan=ha.bianli2(ha.head,s2);
cout<<huan.s1;
s2=huan.s0;
}
cout<<endl;
}}
}
return 0;
}