기본 콘텐츠로 건너뛰기

개발 공부 - [Huffman Coding] 압축 (Compression) - 5

제 4단계
Codeword 검색하기


인코딩
- 데이터 파일을 압축하기 위해서는 [데이터 파일을 다시 시작부터 읽으면서 run들을 하나씩 인식한 후 ] 해당 run에 부여된 codeword를 검색하다.
- 허프만 트리에서는 모든 run들이 리프노드에 위치하므로 검색하기 불편하다.
- 따라서 검색하기 편리한 구조를 만들어야 한다.

= 런들이 트리 구조로 되어 있어서 AAA라는 run이 어디에 있는지, 어떤 애가 AAA인지 찾는게 상당히 번거롭게 되어 있음. (규칙성이 없어서 불편함)
이제 4단계에서는 tree 구조 필요가 없어서 다른 자료구조 형태로 변경한다.

예전 가이드 : 해시맵 구조로 변경
현재 가이드 : 연결리스트로 변경 (hashing 비슷한 것)

symbol                : A 
codeword            :  0
freg                    : 1
runLen                : 1
codewordLen        : 2 
right                   : 

이런 식으로 되어 있으면 runLen이 1이고 symbol이 A 이므로 A이다.


symbol                : A 
codeword            :  2
freg                    : 2
runLen                : 2
codewordLen        : 2 
right                   : 

이런 식으로 되어 있으면 runLen이 2이고 symbol이 A이므로 AA이다.


이렇게 symbol이 동일한 run 들을 하나의 연결리스트로 저장한다.
각 run의 right 필드는 다음 노드를 가리키는 링크 필드로 사용한다.
한 run에 대해 마지막 노드는 right 값이 null이 된다.

이렇게 동일한 심볼의 run들을 연결 리스트로 만들어서 저장한다.
크기가 256인 chars 라는 연결 리스트 배열을 만들어서 사용한다.
아스키 코드로 A를 변환해서 그 거를 정수형으로 symbol 에 저장하고 하는 식으로 사용한다.


private Run [] chars = new Run [256];
    
     /* Huffman 트리의 모든 리프노드들을 chars에 recursion으로 저장한다 */
     private void storeRunsIntoArray(Run p) {
         if (p.left == null && p.right == null) {
             insertToArray(p);
             // 배열 chars[(unsigned int)p.symbol] 가 가리키는 연결리스트의 맨 앞에 p를 삽입한다.
         }
         else {
             storeRunsIntoArray(p.left);
             storeRunsIntoArray(p.right);
         }
     }

     public void compressFile(RandomAccessFile fIn) {
         collectRuns(fIn);
         createHuffmanTree();
         assignCodewords(theRoot, 0, 0);
         storeRunsIntoArray(theRoot);
     }


Run 검색하기

- symbol과 runLength가 주어질 때 배열 chars 를 검색하여 해당하는 run을 찾아 반환하는 메서드를 작성한다.

public Run findRun(byte symbol, int length){
    //배열 chars에서 (symbol, length)에 해당하는 run을 찾아 반환한다.

}



 



댓글

이 블로그의 인기 게시물

Ebook - 전자책 drm 상관 없이 pdf로 만들기

yes24와 교보문고에서 ebook을 구매 해야 했는데 너무 불편하고, 필기가 매우 화날 정도로 안 좋아서 원시적으로 사용하기로 했다. 1. 목적 : ebook에서 필기 및 사용이 불편하여 pdf로 변환  2. 용도 : 개인 사용 목적이며 화질이 다소 저하되어도 필기만 용이하면 상관 없음 3. 방법 1) 휴대폰 및 카메라로 동영상을 촬영했다. DRM 때문에 프로그램으로는 촬영이 안 되는 것을 확인했다. (사실 개인 사용 목적이면 기본 화면 캡쳐를 사용해도 된다...) 2) 마우스 클릭 해주는 매크로를 사용했다. (1) key_macro.exe > https://blog.daum.net/pg365/250 듀얼 모니터에서 위치 이탈 현상이 있긴 해도 괜찮았다. (2) AutoClick.exe > http://bestsoftwarecenter.blogspot.com/2011/02/autoclick-22.html 이 걸로 잘 사용했다. 3초마다 한 번 클릭하도록 사용했다. 3) 동영상을 이미지로 변경해주는 프로그램을 사용했다. Free Video to JPG Converter > https://www.dvdvideosoft.com/products/dvd/Free-Video-to-JPG-Converter.htm (240826: 다운로드 시 정상적으로 되지 않아서 URL 수정) 일 하면서 듀얼 모니터에 켜 놨는데 속도가 괜찮았다. * Every frame 으로 사용해야 한다. 4) 중복 사진 제거해주는 프로그램을 사용했다. VlsiPics  > http://www.visipics.info/index.php?title=Main_Page 생각보다 느리니 퇴근시에 걸어놓고 가면 된다. 한번 play가 끝나면 Auto-select 하고 Delete 하면 된다. 5) 이미지를 일괄 Crop 작업 해주는 프로그램을 사용했다. JPEGCrops > https://jpegcrops.softonic.kr/ *...

개발 공부 - json JSONObject 사용 시 백슬래시(\), 원화 표시(\) 제거 및 치환

import org.json.simple.JSONObject; String dataString = new String(authData.toJSONString()); dataString = dataString.replaceAll("\\\\", ""); String 으로 안 바뀌는 가 싶어서 String 으로 변환 해 주고 작업 하였다. 사실 toJSONString 해도 정상 동작 해야 하는데 이유를 잘 모르겠음. 그리고 나서 다시 이클립스 구동 하니 toString 도 먹은 걸로 봐서 이상하다고 생각! String dataString = authData.toString(); dataString = dataString.replaceAll("\\\\", ""); 어쨌든 백 슬래시 제거를 해줘야 하는데 \\ 도 아니고 \\\\를 해야 변환이 가능했다는 결말이었습니다. 참고 : https://stackoverflow.com/questions/15450519/why-does-string-replace-not-work/15450539 test =test.replace("KP", "");  replace 후에 담아 주지 않으면 적용이 안 됩니다!

개발 공부 - OracleXETNSListener 서비스가 로컬 컴퓨터에서 시작했다가 중지되었습니다.

여러 가지 요인이 있지만 PC 이름 변경시 OracleXETNSListener 서비스 시작이 불가능합니다. 고치는 법은 C:\oraclexe\app\oracle\product\11.2.0\server\network\ADMIN 와 같은 설치 경로에서 listener.ora와 tnsnames.ora 의 pc명을 바꾼 PC명으로 바꿔주면 됩니다. 그래도 안 된다면 cmd 창에서 services.msc 를 입력 후 OracleXETNSListener 서비스를 시작 시키면 됩니다. 오류명: OracleXETNSListener 서비스가 로컬 컴퓨터에서 시작했다가 중지되었습니다. 일부 서비스는 다른 서비스 또는 프로그램에서 사용되지 않으면 자동으로 중지됩니다. 참고한 사이트들 1. http://blog.naver.com/visioner7/120165951652 2. http://database.sarang.net/?inc=read&aid=6819&criteria=oracle&subcrit=&id=&limit=20&keyword=ora-12560&page=5 이런 걸 보면 오라클은 앙칼진 시골 아가씨야