Golang

位向量-go

2018-12-18  本文已影响7人  神奇的考拉

1、概述

在实际的使用中,有些集合元素都是小的非负整型,且集合元素较多,比如数据流分析领域,针对集合的操作多数是求交并集,位向量是个理想的数据结构。
位向量使用一个无符号整数值的slice,每一位代表集合中的一个元素,比如设置第i位的元素,则认为集合包含i。

实现: 每一个字拥有bits =32<<(^uint(0)>>63)位(为了兼容32bits、64bits系统,偷巧的方式 <_>),通过使用源数/bits得到其在slice中索引,再使用源数%bits得到其在uint数据位的内索引,使用位向量同一个索引下会存在多个元素,故而使用uint的每个bit代表一个元素是否存在:1存在 0不存在

2、实现

import (
    "bytes"
    "fmt"
)

const SYSTEM_BIT int =  (32<<(^uint(0)>>63)) // 64
// IntSet: 一个字64bits
type IntSet struct {
    words []uint
}

// Has:是否存在
// 通过使用x得到下标索引及其内位的索引,再判断对应下标是否越界 同时uint内位索引是否有元素(1:有  0:无)
func(s *IntSet) Has(x int) bool{
    word, bit := x/SYSTEM_BIT, uint(x%SYSTEM_BIT) // 字索引  字内位索引
    return word < len(s.words) && s.words[word]&(1 << bit) != 0
}

// Add: 添加
// 根据x得到其在slice中的下标索引及其内位的索引,首先判断当前下标索引是否已存在
// 存在: 代表已有元素存在, 则直接将该索引的元素与位移偏移量 进行 |=(或)操作,这样该索引内容变为两者的和,对应uint内位为1
// 不存在:需要添加新的位置来填充,并将uint其中对应bit位置为1,最后执行元素存在时的或操作
func (s *IntSet) Add(x int){
    word, bit := x/SYSTEM_BIT, uint(x%SYSTEM_BIT)
    for word >= len(s.words){
        s.words = append(s.words,0)
    }
    s.words[word] |= 1 << bit
}

// UnionWith: 并集
// 迭代t中的每个元素
// 对应的s中未存在 则直接append即可
// 若是存在 直接将索引位上的元素与添加元素直接进行 |= 操作即可
func (s *IntSet) UnionWith(t *IntSet){
    for i, tword := range t.words{
        if i < len(s.words){
            s.words[i] |= tword
        } else{
            s.words = append(s.words, tword)
        }
    }
}

// Len: 长度(保留相同索引的不同位的内容)
func (s *IntSet) Len() int{
    count := 0
    for _, word := range s.words{   // 索引位内容
        for word != 0{                   // 内索引位的内容
            count++
            word &= word - 1
        }
    }
    return count
}

// Remove: 移除
func (s *IntSet) Remove(x int){
    word, bit := x/SYSTEM_BIT, uint(x%SYSTEM_BIT)
    s.words[word] &^= 1 << bit     // 与添加操作相反 通过&^(对应位置的值通过与操作位移的异或)
}

// Clear: 清空
func (s *IntSet) Clear(){
    for i := range s.words{
        s.words[i] = 0      // 仅将对应下标索引对应的内容置为0即可
    }
}

// Copy:复制
func (s *IntSet) Copy() *IntSet{
    ss := &IntSet{}
    ss.words = make([]uint, len(s.words))
    copy(ss.words, s.words)
    //
    return ss
}

// String: 字符串表现形式
func (s *IntSet) String() string{
    var buf bytes.Buffer
    buf.WriteByte('{')
    for i, word := range s.words{
        if word == 0{
            continue
        }
        for j := 0; j < 64; j++{
            if word & (1 << uint(j)) != 0{
                if buf.Len() > len("{"){
                    buf.WriteByte(' ')
                }
                fmt.Fprintf(&buf, "%d", 64*i + j)
            }
        }
    }
    buf.WriteByte('}')
    return buf.String()
}

3、使用


func main() {
    //
    var x,y bitvector.IntSet
    x.Add(1)
    x.Add(144)
    x.Add(9)
    fmt.Println(x.String())

    // 添加
    y.Add(9)
    y.Add(42)
    fmt.Println(y.String())

    // 并集
    x.UnionWith(&y)
    fmt.Println(x.String())

    // 存在
    fmt.Println(x.Has(9), x.Has(123))
    //var udatas [4]uint64
    //udatas[0] = 1
    //udatas[0] |= 2
    //fmt.Println(udatas, udatas[0])

    // 移除
    y.Clear()
    fmt.Println(y)

    // 添加
    y.Add(9)
    y.Add(42)
    fmt.Println(y.String())

    // 长度
    len := x.Len()
    fmt.Printf("the Intset's length is %d \n", len)

    // 复制
    sy := y.Copy()
    fmt.Println(sy)
}
上一篇下一篇

猜你喜欢

热点阅读