视频入门

目标

在本次会议中:

从相机捕捉视频

通常,我们用相机捕捉直播。OpenCV 为此提供了一个非常简单的接口。我们用相机捕捉一个视频(我用的电脑内置摄像头),将它转换成灰度视频并显示。仅仅是一个简单的开始。

去获取一个视频,你需要创建一个VideoCapture对象。它的参数可以是设备索引或者一个视频文件名。设备索引仅仅是摄像机编号。通常会连接一台摄像机(as in my case)。所以我只传了 0(或者-1)。你可以通过传 1 来选择第二个摄像机,以此类推。之后,你能逐帧捕获。但是最后,不要忘记释放这个 Capture 对象。

  1. import numpy as np
  2. import cv2 as cv
  3. cap = cv.VideoCapture(0)
  4. while(True):
  5. # 一帧一帧捕捉
  6. ret, frame = cap.read()
  7. # 我们对帧的操作在这里
  8. gray = cv.cvtColor(frame, cv.COLOR_BGR2GRAY)
  9. # 显示返回的每帧
  10. cv.imshow('frame',gray)
  11. if cv.waitKey(1) & 0xFF == ord('q'):
  12. break
  13. # 当所有事完成,释放 VideoCapture 对象
  14. cap.release()
  15. cv.destroyAllWindows()

cap.read() 返回一个 bool 值(True/False)。如果加载成功,它会返回True。因此,你可以通过这个返回值判断视频是否结束。

有时,cap 可能没有初始化 capture。在这种情况下,此代码显示错误。你可以通过该方法 cap.isOpened() 检查它是否初始化。如果它是 True,那么是好的,否则用 cap.open() 打开在使用。

你也可以通过使用 cap.get(propId) 函数获取一些视频的特征,这里的 propld 是一个 0-18 的数字,每个数字代表视频的一个特征 (如果这个视频有),或者使用 cv::VideoCapture::get() 获取全部细节。它们中有些值可以使用 cap.set(propId, value) 修改。Value 就是你想要的新值

例如:我可以用 cap.get(cv.CAP_PROP_FRAME_WIDTH) 获得宽, cap.get(cv.CAP_PROP_FRAME_HEIGHT) 获得高。它返回的是 640x480,但是我想把它修改为 320x240。仅使用 ret = cap.set(cv.CAP_PROP_FRAME_WIDTH,320)ret = cap.set(cv.CAP_PROP_FRAME_HEIGHT,240)

Note

  • 如果给你报错了,确保用任意其他的相机程序 (如 Linux 下的 Cheese 程序) 可以正常工作

播放视频文件

它和从相机捕获一样,只需要用视频文件名更改相机索引。同时显示 frame,为 cv.waitKey() 使用合适的时间。如果它太小,视频将非常快,如果太大,视频将很慢 (嗯,这就是如何显示慢动作)。正常情况下,25 毫秒就可以了。

  1. import numpy as np
  2. import cv2 as cv
  3. cap = cv.VideoCapture('vtest.avi')
  4. while(cap.isOpened()):
  5. ret, frame = cap.read()
  6. gray = cv.cvtColor(frame, cv.COLOR_BGR2GRAY)
  7. cv.imshow('frame',gray)
  8. if cv.waitKey(1) & 0xFF == ord('q'):
  9. break
  10. cap.release()
  11. cv.destroyAllWindows()

Note

  • 确保 ffmpeg 和 gstreamer 安装合适的版本。有时,使用 Video Capture 是比较头痛的,主要是因为错误的安装 ffmpeg 或 gstreamer。

保存视频

我们捕获视频,逐帧处理然后保存下来。对于图像来说,是非常的简单,就用 cv.imwrite()。这里需要做更多的工作。

这次我们创建一个 VideoWriter 对象。我们应该指定输出文件的名字 (例如:output.avi)。然后我们应该指定 FourCC 码 (下一段有介绍)。然后应该传递每秒帧数和帧大小。最后一个是 isColor flag。如果是 True,编码器期望彩色帧,否则它适用于灰度帧。

FourCC 是用于指定视频解码器的 4 字节代码。这里 fourcc.org 是可用编码的列表。它取决于平台,下面编码就很好。

  • In Fedora: DIVX, XVID, MJPG, X264, WMV1, WMV2. (XVID 是最合适的. MJPG 结果比较大. X264 结果比较小)
  • In Windows: DIVX (还需要测试和添加跟多内容)
  • In OSX: MJPG (.mp4), DIVX (.avi), X264 (.mkv).

对于 MJPG, FourCC 的代码作为 cv.VideoWriter_fourcc(‘M’,’J’,’P’,’G’)cv.VideoWriter_fourcc(*’MJPG’) 传递。

下面的代码从相机捕获,在垂直方向翻转每一帧然后保存它。

  1. import numpy as np
  2. import cv2 as cv
  3. cap = cv.VideoCapture(0)
  4. # 声明编码器和创建 VideoWrite 对象
  5. fourcc = cv.VideoWriter_fourcc(*'XVID')
  6. out = cv.VideoWriter('output.avi',fourcc, 20.0, (640,480))
  7. while(cap.isOpened()):
  8. ret, frame = cap.read()
  9. if ret==True:
  10. frame = cv.flip(frame,0)
  11. # 写入已经翻转好的帧
  12. out.write(frame)
  13. cv.imshow('frame',frame)
  14. if cv.waitKey(1) & 0xFF == ord('q'):
  15. break
  16. else:
  17. break
  18. # 释放已经完成的工作
  19. cap.release()
  20. out.release()
  21. cv.destroyAllWindows()

其他资源

练习