基于C中一個行壓縮圖的簡單實現代碼

2020-01-26 16:17:56

字體：大中小

來源：轉載

供稿：網友

首先簡單說一下什么是行壓縮圖，其實嚴格意義上應該是行壓縮矩陣。正常情況下，矩陣是用二維數組簡單存儲的，但是如果是稀疏矩陣，也就是零很多的時候，這樣比較浪費空間。所以就有各種節省空間的存儲方式，三元組存儲就是其中一種。

什么是三元組呢？一個三元組就是(row,col,value)，這樣把所有不為零的值組成一個向量。這種存儲方式比二維數組節省了不少空間，當然還可以進一步節省，因為三元組里面row或者col重復存儲了，一行或者一列存一次就行了，按這種思路走下去就是行壓縮存儲了。

那具體什么是行壓縮存儲呢？行壓縮存儲的思想就是，把所有不為零的值按行訪問的順序組成一個向量，然后再把每一行值不為0的列的下標存下來，這個兩個向量的大小和稀疏矩陣中不為0的值得個數相同，當然要實現對行壓縮矩陣的訪問，還要把每一行的不為0的列的下標在第二個向量中開始的位置存下來，有人把這個叫做指針。有了這三個向量就可以實現對矩陣實現高效的按行訪問了。行壓縮存儲比三元組優秀的不僅是空間的壓縮，還有就是行訪問時的高效。三元組如果是有序的，可以二分查找來訪問一行，但是行壓縮存儲按行訪問時的時間復雜度是常數級的。大家可以參考下面這個行壓縮矩陣示意圖：

可能你會有疑問，你明明實現的行壓縮圖，怎么扯了這么多行壓縮矩陣呢？其實圖和矩陣是等價的，矩陣的一行可以看做是圖一個節點的出邊，矩陣的一列可以看做圖一個節點的入邊。當然這里需要滿足兩個條件：第一個就是圖節點編號必須是從0或者1開始的連續數值（這個可以通過對圖的節點做一次映射解決），第二個就是圖必須至少是弱連通的（非連通圖可以拆成連圖片）。實現了稀疏矩陣的高效存儲訪問，也就實現了圖的高效存儲訪問。

下面來說一下，我的實現。我的實現跟經典的行壓縮矩陣有兩個不同：第一個就是經典的行壓縮矩陣沒有考慮一行全為0的情況，我對這種情況做了處理（之所以處理當然不是因為我無聊，而是因為有這個需求）。第二個就是經典的行壓縮圖對按列訪問比較慢（當然是相對于按行訪問的速度而言），對行壓縮圖按列訪問時，時間復雜度是線性的。我也對這種情況做了處理。

這里簡單說一下我的思路：

第一個問題，我是通過將所有指針默認設為-1，即表示該行可能全為0，只有當有非零值時才設置為其正確的指針。當然訪問時也要做相應的處理。

第二個問題，我是這樣解決的。我按列壓縮存儲的方式，存了一份每一列不為0的行下標，以及每一列不為0的行下標開始的位置。這樣我的實現中就多了兩個向量，浪費了存儲空間，但是提高了按列訪問時的效率。

好了，talk is cheap，show me the code。下面是我的代碼（可能有錯，我只做了簡單的測試）

利用邊向量構造壓縮圖

復制代碼代碼如下:

/*
* buildGraph 利用邊向量構造壓縮圖
* 對邊分別按第一個頂點、第二個頂點排序
* 然后分別按行壓縮圖和列壓縮圖構造行、列索引和指針
* 全零行和全零列,指針置為-1
*/
    private void buildGraph(Vector<Edge> edges) {
        int edgeSize = edges.size();
        weight = new Vector<Float>(edgeSize);
        rowIndex = new Vector<Integer>(edgeSize);
        rowPtr = new Vector<Integer>(nodeCount + 1);
        colIndex = new Vector<Integer>(edgeSize);
        colPtr = new Vector<Integer>(nodeCount + 1);
        // set default value as -1
        for (int i = 0; i < nodeCount; ++i) {
            rowPtr.add(-1);
            colPtr.add(-1);
        }
        rowPtr.add(edges.size());
        colPtr.add(edges.size());

        // sort the edge based on first node
        EdgeBasedOnFirstNodeComparator cmp = new EdgeBasedOnFirstNodeComparator();
        Collections.sort(edges, cmp);
        // build row index and pointer
        int curNode = edges.elementAt(0).getFirstNode();
        int curPtr = 0;
        for (int i = 0; i < edgeSize; ++i) {
            Edge e = edges.elementAt(i);
            // System.out.println("curNode" + curNode + "firstNode: "
            // + e.getFirstNode());
            weight.add(e.getWeight());
            rowIndex.add(e.getSecondNode());
            if (curNode != e.getFirstNode()) {
                rowPtr.set(curNode, curPtr);
                curNode = e.getFirstNode();
                curPtr = i;
            }

        }
        rowPtr.set(curNode, curPtr);
        // sort the edge based on second node
        EdgeBasedOnSecondNodeComparator cmp2 = new EdgeBasedOnSecondNodeComparator();
        Collections.sort(edges, cmp2);
        // build column index and pointer
        curNode = edges.elementAt(0).getSecondNode();
        curPtr = 0;
        for (int i = 0; i < edgeSize; ++i) {
            Edge e = edges.elementAt(i);
            colIndex.add(e.getFirstNode());
            if (curNode != e.getSecondNode()) {
                colPtr.set(curNode, curPtr);
                curNode = e.getSecondNode();
                curPtr = i;
            }

        }
        colPtr.set(curNode, curPtr);
    }

復制代碼代碼如下:

獲得一個節點的出邊
/*
* getOutEdges 返回結點所有的出邊(即所有由結點指出的邊)
*
* @param node 要查找的結點
*
* @return 返回結點所有的出邊組成的向量
*/
@Override
public Vector<Edge> getOutEdges(int node) {
    Vector<Edge> res = new Vector<Edge>();
    int startIndex = getStartIndex(node, true);
    if (startIndex == -1) {
        // 沒有出邊的點
        return null;
    }
    int endIndex = getEndIndex(node, true);
    float value;
    Edge e;
    int outNode;
    for (int index = startIndex; index < endIndex; ++index) {
        value = weight.elementAt(index);
        outNode = rowIndex.elementAt(index);
        e = new Edge(node, outNode, value);
        res.add(e);
    }
    return res;
}

獲得一個節點的入邊
?
/*
* getInEdges 獲取結點所有的入邊(即所有指向結點的邊)
*
* @param node 要查找的結點
*
* @return 返回所有由結點入邊組成的向量
*/
@Override
public Vector<Edge> getInEdges(int node) {
    Vector<Edge> res = new Vector<Edge>();
    int startIndex = getStartIndex(node, false);
    // 沒有入邊的點
    if (startIndex == -1) {
        return null;
    }
    int endIndex = getEndIndex(node, false);
    float value;
    Edge e;
    int inNode;
    for (int index = startIndex; index < endIndex; ++index) {
        inNode = colIndex.elementAt(index);
        value = getWeight(inNode, node);
        e = new Edge(inNode, node, value);
        res.add(e);
    }
    return res;
}

這里訪問方式就跟按行訪問不一樣了，行訪問時，直接讀weight向量里面對應的值就行了，這里不行，應該weight向量是按行訪問順序存的。我的解決方法，獲取入節點，然后對整個節點對按行訪問獲得對應值。這樣雖然繞了一下，但是對于稀疏圖來說，基本上也是常數級的。下面是getWeight的代碼

復制代碼代碼如下:

/*
     * getWeight 獲得特定邊的weight
     */
    private float getWeight(int row, int col) {
        int startIndex = getStartIndex(row, true);
        if(startIndex==-1)
            return 0;
        int endIndex = getEndIndex(row, true);
        for (int i = startIndex; i < endIndex; ++i) {
            if (rowIndex.elementAt(i) == col)
                return weight.elementAt(i);
        }
        return 0;
    }

最后是對行或者列全0時的特殊處理，這里處理，體現在從指針向量獲取開始和結束位置的函數上

復制代碼代碼如下:

/*
* getStartIndex 獲取特定頂點的開始索引
*/
    private int getStartIndex(int node, boolean direction) {
        // true : out edge
        if (direction)
            return rowPtr.elementAt(node);
        else
            return colPtr.elementAt(node);
    }

　
?
/*
* getEndIndex 獲取特定頂點的結束索引
*/
    private int getEndIndex(int node, boolean direction) {
        // true:out edge
        if (direction) {
            int i = 1;
            while ((node + i) < nodeCount) {
                if (rowPtr.elementAt(node + i) != -1)
                    return rowPtr.elementAt(node + i);
                else
                    ++i;
            }
            return rowPtr.elementAt(nodeCount);
        } else {
            int i = 1;
            while ((node + i) < nodeCount) {
                if (colPtr.elementAt(node + i) != -1)
                    return colPtr.elementAt(node + i);
                else
                    ++i;
            }
            return colPtr.elementAt(nodeCount);
        }
    }