如何在C中实现位集?

问题描述 投票:0回答:7

我一直在Java中使用Bitset类,我想在C中做类似的事情。我想我必须像C中的大多数东西一样手动完成它。什么是有效的实现方法?

byte bitset[]

也许

bool bitset[]

c bitset
7个回答
19
投票

CCAN 有一个可以使用的位集实现:https://ccodearchive.net/info/jset.html

但是,如果您最终自己实现它(例如,如果您不喜欢对该包的依赖),则应该使用整数数组并使用计算机体系结构的本机大小:

#define WORD_BITS (8 * sizeof(unsigned int))

unsigned int * bitarray = (int *)calloc(size / 8 + 1, sizeof(unsigned int));

static inline void setIndex(unsigned int * bitarray, size_t idx) {
    bitarray[idx / WORD_BITS] |= (1 << (idx % WORD_BITS));
}

不要使用特定的大小(例如使用 uint64 或 uint32),让计算机使用它想要使用的内容并使用 sizeof 进行适应。


16
投票

没有人提到 C FAQ 推荐的内容,这是一堆很好的旧宏:

#include <limits.h>     /* for CHAR_BIT */

#define BITMASK(b) (1 << ((b) % CHAR_BIT))
#define BITSLOT(b) ((b) / CHAR_BIT)
#define BITSET(a, b) ((a)[BITSLOT(b)] |= BITMASK(b))
#define BITCLEAR(a, b) ((a)[BITSLOT(b)] &= ~BITMASK(b))
#define BITTEST(a, b) ((a)[BITSLOT(b)] & BITMASK(b))
#define BITNSLOTS(nb) ((nb + CHAR_BIT - 1) / CHAR_BIT)

(通过 http://c-faq.com/misc/bitsets.html


3
投票

嗯,byte bitset[] 似乎有点误导,不是吗?

在结构中使用位字段,然后您可以维护这些类型的集合(或按照您认为合适的其他方式使用它们)

struct packed_struct {
  unsigned int b1:1;
  unsigned int b2:1;
  unsigned int b3:1;
  unsigned int b4:1;
  /* etc. */
} packed;

2
投票

我推荐我的BITSCAN C++库(1.0版本刚刚发布)。 BITSCAN 专门针对快速位扫描操作。我用它来实现涉及简单无向图的 NP-Hard 组合问题,例如最大集团(请参阅 BBMC 算法,了解领先的精确求解器)。

可在此处查看 BITSCAN 与标准解决方案 STL bitset 和 BOOST dynamic_bitset 之间的比较: http://blog.biicode.com/bitscan-efficiency-at-glance/


1
投票

您可以使用 bitsPerItem

1
尝试我的
PackedArray
代码。

它实现了一个随机访问容器,其中项目以位级别打包。换句话说,它的行为就好像你能够操纵一个例如

uint9_t
uint17_t
数组:

PackedArray principle:
  . compact storage of <= 32 bits items
  . items are tightly packed into a buffer of uint32_t integers

PackedArray requirements:
  . you must know in advance how many bits are needed to hold a single item
  . you must know in advance how many items you want to store
  . when packing, behavior is undefined if items have more than bitsPerItem bits

PackedArray general in memory representation:
  |-------------------------------------------------- - - -
  |       b0       |       b1       |       b2       |
  |-------------------------------------------------- - - -
  | i0 | i1 | i2 | i3 | i4 | i5 | i6 | i7 | i8 | i9 |
  |-------------------------------------------------- - - -

  . items are tightly packed together
  . several items end up inside the same buffer cell, e.g. i0, i1, i2
  . some items span two buffer cells, e.g. i3, i6

0
投票

像往常一样,您需要首先决定需要对位集执行哪种操作。也许是 Java 定义的某个子集?之后,您可以决定如何最好地实施它。您当然可以查看 OpenJDK 中 BitSet.java 的源代码来获取想法。


-3
投票

将其设为 unsigned int 64 的数组。

© www.soinside.com 2019 - 2024. All rights reserved.