我最近观看了一个 YouTube 视频,其中一个人用相机来识别何时将魔方举到其上,它捕获了 9 个正方形的颜色组合,然后拍摄了魔方的照片并在他的屏幕上显示了 3x3 网格电脑。 这是一种什么样的编程?我应该从哪里开始阅读才能了解这种事情?具体来说,控制相机,让它挑选出图像的某些部分并翻译该数据。
这属于“计算机视觉”主题,OpenCV 将是一个很好的切入点......http://opencv.org/
也许看看这个教程:- 级联分类器
对于初学者,http://opencv.willowgarage.com/documentation/structural_analysis_and_shape_descriptors.html
然后http://www710.univ-lyon1.fr/~bouakaz/OpenCV-0.9.5/docs/ref/OpenCVRef_ImageProcessing.htm
代码示例 http://code.google.com/p/blockhead/source/browse/trunk/Xcode/CubeFinder.cpp?r=8
和http://blockhead.googlecode.com/svn-history/r13/trunk/CubeFinder.cpp