贪心算法-构造哈夫曼数及生成哈夫曼编码,编程实现

哈夫曼树

1.概念：

给定n个权值最为n个叶子的节点，构建成一颗二叉树。如果次树的带权路径长度最小，则称此二叉树为最优二叉树，也叫哈夫曼树。
WLP：带权路径长度
- 公式：
- Wk:第k个叶子的节点权值
- Lk:根节点到第k个叶子的节点长度

例如下列二叉树：

给定4个叶子节点，权值分别为{2，3，5，8}，可以构造出4中形状不同的二叉树，但它们的带权路径长度可能不同。

如上图可看出：1、最后两个树的带权路径长度相同且也是最小的，所以可看作哈夫曼树

2、权值最小的节点越靠下，越大越靠近根节点

2.构建哈夫曼树

（1）、在{2，3，5，8}这几个节点看作叶子节点（即后面没有子节点）

（2）、在这几个节点中选出权值最小和次小的两个节点。构成一个新二叉树（最小为左字节的、次小为右子节点），新二叉树的权值为这两个权值之和.

（3）、删除已经使用过的节点。将新创建的节点加入到还没被使用过的节点集合中，找出最小和次小的节点权值。又构成一颗新的二叉树。

（4）、重复(2)的操作

（5）、重复上面操作：删除已使用的节点，将新的节点加入未使用节点的集合中，发现只有一个节点，其权值为18.则此哈夫曼树创建完成，根节点权值为18.

代码如下：


import java.util.ArrayList;
import java.util.Collections;
import java.util.List;
/**
 * 构造哈夫曼树
 */
public class test1 {
    public static void main(String[] args) {
        int[] arr={2,3,5,8};
        //调用自定义的哈夫曼树方法，生成哈夫曼树
        hafmantree(arr);
    }
    /**
     * ,构造哈夫曼数方法
     *
     * @param arry
     */
    public static void hafmantree(int[] arry) {
        //创建集合用于存放节点值
        List<Node> nlis = new ArrayList<Node>();
        //遍历集合
        for (int value : arry) {
            //将每个数组元素看作Node节点对象，并存入list集合内
            nlis.add(new Node(value));
        }
       /*
       由于集合中存入的是一个个的Node对象，而Node对象已经被我们声明成了按照从小到大的可排序对象。
       所以这里我们为可以通过Collections工具类中的sort方法进行排序
        */
        //循环条件：只有一个节点，即最终根节点
        while (nlis.size() > 1) {
            Collections.sort(nlis);
            //查看集合中还未被使用的节点
            System.out.println(nlis);
            //到了这里说明集合中的所有节点（权值）都是按照从小到大的顺序
            //获取最小的节点值（二叉树左节点）:子节点
            Node lileft = nlis.get(0);
            //获取第2小的节点值（二叉树右节点）：子节点
            Node lireght = nlis.get(1);
       /*创建新的Node节点对象（二叉树）:
            此节点对象是最小的两个节点之和所生成的最新的节点。三个节点可以看成一个二叉树，即：
             根节点(insternode对象)、左子节点(lileft.value)、右子节点(lireght.value)
        */
            Node insternode = new Node(lileft.value + lireght.value);
            //此二叉树的左节点
            insternode.left = lileft;
            //此二叉树的右节点
            insternode.right = lireght;
            //删除已经被处理过的节点
            nlis.remove(lileft);
            nlis.remove(lireght);
            //将最新的节点加入到list集合中
            nlis.add(insternode);
            //重新对最新的list数组进行排序
            Collections.sort(nlis);
        }
        //查看最终根节点
        System.out.println(nlis);
    }
}
/**
 * ,构造哈夫曼数节点类,
 * 此类也可以看成一个二叉树：根节点(Node对象)、左节子点(left)、右字节点(right)
 * 实现Comparable接口：说明此类是可通过Collections工具类排序的，
 */
class Node implements Comparable<Node> {
    int value;  //每个节点的值（权值）
    Node left;   //每个二叉树的左指向节点
    Node right;   //每个二叉树的右指向节点
    //构造方法，这里只需要初始化value实例变量，用于对象的赋值，而 left 与 right 本身就是此对象，可直接用于value赋值
    public Node(int value) {
        this.value = value;
    }
    @Override
    public String toString() {
        return "Node{" +
                "value=" + value +
                '}';
    }
    //支持从小到大排序
    @Override
    public int compareTo(Node o) {
        return this.value - o.value;
    }
}

结果：

3.构建哈夫曼编码

这里是对一段字符串进行哈夫曼编码，所以需要先处理字符串
在哈夫曼树的基础上，规定了路径编码。
遍历已经创建好了的哈夫曼树，从它的根节点遍历次树到叶子节点，左子路径编码：0 、右子路径编码：1


import java.util.*;
/**
 * 构造哈夫曼数+生成哈夫曼编码,编程实现。
 */
public class test1 {
    public static void main(String[] args) {
        //需要转换为哈夫曼编码的字符串
        String valus="asdsgddbhj ,sjsh";
        //将字符串存以node对象存入list集合中
        List<Node> list = ListAndNode(valus);
        //生成哈夫曼树
        Node node = HFMTree(list);
        //得到哈夫曼编码
        HFMTable(node,"",andindex);
        System.out.println(yezijied);   //{32=1010, 97=1011, 98=1100, 115=01, 100=111, 103=1101, 104=001, 106=100, 44=000}
    }
/*
第四步：
创建哈夫曼编码表：将叶子节点以0、1表示。0===》向左子节点走。1===》向右子节点走
    yezijied:存放叶子节点对应的哈夫曼编码。此集合作业与全局
    andindex：拼接编码。(拼接对应的0或1，形参最终的哈夫曼编码)
 */
    static Map<Byte,String> yezijied=new HashMap<>();
    static  StringBuilder andindex=new StringBuilder();
    /**
     *
      * @param node：节点
     * @param index：路径表示：左路径为0.右路劲为1
     * @param sub：拼接路径，使其成为对应叶子节点的哈夫曼码
     */
public static void HFMTable(Node node,String index,StringBuilder sub){
    //
    StringBuilder gitindex=new StringBuilder(sub);
    //拼接路径
    gitindex.append(index);
    //如果节点为空就不需要处理
    if (node!=null) {
        //如果当前节点不是叶子节点
        if (node.value == null) {
            //如果节点不为空就递归其左边节点。并设置向左为0
            HFMTable(node.left, "0", gitindex);
            //如果节点不为空就递归其右边节点。并设置向右为1
            HFMTable(node.right, "1", gitindex);
        } else {
            //为叶子节点就将其存入map集合中
            yezijied.put(node.value, gitindex.toString());
        }
    }
}
    /*
    第三步：
    @param nodes:已经存入list集合中的Node节点
    创建字符串的哈夫曼树结构
     */
    public static Node HFMTree(List<Node> nodes){
        //循环条件：节点数必须大于1.如果等于1就是一个节点(根节点),没有分支
        while (nodes.size()>1){
            //排序list集合，根据权值(节点个数)从小到大排序
            Collections.sort(nodes);
            /*
            创建一个二叉树：
            feiyezijied:根节点
            nodeleft：左子节点
            noderight：右子节点
             */
            //得到权值最小的两个节点.这两个节点分别可看作左右两个子节点
            Node nodeleft = nodes.get(0);
            Node noderight = nodes.get(1);
            //创建新的Node对象：这可以想象为两个叶子节点生成的根节点，
            // 由于哈夫曼数的原理，需要编码的值是叶子节点，而叶子节点上的父节点只是通过叶子节点虚拟创建的节点，
            // 是为了形成一整颗完整的树。所以它是没有字符串原始值，，其可用两个字节的权值之和标记
            Node feiyezijied=new Node(null,nodeleft.quanzhi+noderight.quanzhi);
            //Node对象的左字节点
            feiyezijied.left=nodeleft;
            //Node对象的右字节点
            feiyezijied.right=noderight;
            //删除原集合中的以使用的节点对象.即上面已经每次获得的集合中两个最小的节点
            nodes.remove(nodeleft);
            nodes.remove(noderight);
            //将新创建的Node节点加入list集合中
            nodes.add(feiyezijied);
            //重新对list集合排序
            Collections.sort(nodes);
        }
        //返回最终根节点
        return nodes.get(0);
    }
    /*
    第二步：
    @param valus:传入需要编码的字符串，将其变成节点
    将需要编码的字符串，每个原始值(ASCIIM码)以节点(Node)对象形式传入list集合中。
    而节点对象Node初始化了value与quanzhi，所以节点对象是包括这两个值，所以将每个节点对象当作一个map.
    设k=value、v=quanzhi
     */
    public static List<Node> ListAndNode(String valus){
        //将字符对象存入byte数组。
        byte[] bytes = valus.getBytes();
        //创建List集合
        List<Node> nodes=new ArrayList<>();
        //创建Map集合
        Map<Byte,Integer> node=new HashMap<>();
        //遍历bytes数组，得到每个字符串的原始值
        for (byte by:bytes){
            //先试着通过传入的第一个k获取v
            Integer index = node.get(by);
            //如果map集合中此原始值对应的个数还没有
            if (index==null){
                node.put(by,1);
            }else {
                node.put(by,index+1);
            }
        }
        //遍历map集合，并将每次遍历的元素，以Node对象的形式存入list集合
        for (Map.Entry<Byte,Integer> n:node.entrySet()){
            nodes.add(new Node(n.getKey(),n.getValue()));
        }
        //最后返回此list集合
        return nodes;
    }
}
  /*
  第一步：
    节点类:其本身可可看作一个概念性的二叉树
    Node对象本身可看作是一个二叉树的根节点
    实现Comparable接口：泛型规定此接口作用与此Node节点，说明此类是可排序的，通过' Collections.sort()'
     */
class Node implements Comparable<Node>{
    Byte value;     //原始值：字符本身的ASCIIM码。因为一段字符串中有许多相同的字符，但相同字符却对应这一个ASCIIM码
    int quanzhi;    //此字符value在一段字符串中出现的次数
    Node left;      //Node对象看作是二叉树的根节点，那么这就是此二叉树的左子节点
    Node right;     //Node对象看作是二叉树的根节点，那么这就是此二叉树的右边子节点
    //构造器初始化 value 、quanzhi。
    public Node(Byte value, int quanzhi) {
        this.value = value;
        this.quanzhi = quanzhi;
    }
    //重写toString：因为我们需要拿到这两个值
    @Override
    public String toString() {
        return "Node{" +
                "value=" + value +
                ", quanzhi=" + quanzhi +
                '}';
    }
    //实现Comparable接口中的方法：手动设置排序规则
    @Override
    public int compareTo(Node o) {
        //设置为通过权值从小到大排序
        return    this.quanzhi-o.quanzhi;
    }
    //前序遍历
    public void qxbl(){
        //先输出当前节点，也就是根节点
        System.out.println(this);
        //如果左子节点不是null节点，就递归遍历输出左子节点.null表示不是叶子节点
        if (this.left!=null){
            this.left.qxbl();
        }
        //同样递归右子节点
        if (this.right!=null){
            this.right.qxbl();
        }
    }
}

标签生成, 算法, 编码