JAVA图像识别——HSV肤色提取

jopen 10年前

OSCHINA上看到各种语言的抓妹子图的程序段,拿来跑一跑,都是爬虫的机制,而地址一般都是固定的,格式固定,才能抓到想要的图,这显示不够智能,于是把作者的代码改掉,变成了个下载图片的爬虫。然后问题就来了,大量的图片,不是我想要的,就这想到了图像识别,目前主要的分支有,找相似图,人脸识别,鉴黄等。

今天要说说肤色提取,大概就暴露了,我要选什么分支了,不多说,不多说 >_<!

肤色提取

开始使用了CSDN上某大神写的一段JAVA代码(用于检测黄色图片),使用了YUV色彩空间。效果还是很不错的。

/**    * flesh    *     * @param c    * @return    */   public static boolean isFlesh(final Color c) {    if ((c.getRed() > 230) && (c.getGreen() > 170) && (c.getBlue() > 190)) {     return false;    }    LDialyzer yuv = LDialyzer.getYuv(c.getRed(), c.getGreen(), c.getBlue());    return ((c.getRed() > 40) && (c.getGreen() > 40) && (yuv.y + 16 > 145)      && (yuv.v + 128 < 173) && (yuv.v + 128 > 133)      && (yuv.u + 128 < 127) && (yuv.u + 128 > 77));   }

但是这段代码,上半部分的依据RGB范围直接PASS掉一部分,这确定是有点果断的,仔细观察RGB色彩空间,会发现还是有一部分的偏黄色被排除了。于是考虑使用HSV色彩空间。

HSV六棱锥

H参数表示色彩信息,即所处的光谱颜色的位置。该参数用一角度量来表示,红、绿、蓝分别相隔120度。互补色分别相差180度。

纯度S为一比例值,范围从0到1,它表示成所选颜色的纯度和该颜色最大的纯度之间的比率。S=0时,只有灰度。

V表示色彩的明亮程度,范围从0到1。有一点要注意:它和光强度之间并没有直接的联系。

RGB转化到HSV的算法

  max=max(R,G,B)

  min=min(R,G,B)

  if R = max, H = (G-B)/(max-min)

  if G = max, H = 2 + (B-R)/(max-min)

  if B = max, H = 4 + (R-G)/(max-min)

  H = H * 60

  if H < 0, H = H + 360

  V=max(R,G,B)

  S=(max-min)/max

HSV转化到RGB的算法

  if s = 0

    R=G=B=V

  else

    H /= 60;

    i = INTEGER(H)

    f = H - i

    a = V * ( 1 - s )

    b = V * ( 1 - s * f )

    c = V * ( 1 - s * (1 - f ) )

    switch(i)

      case 0: R = V; G = c; B = a;

      case 1: R = b; G = v; B = a;

      case 2: R = a; G = v; B = c;

      case 3: R = a; G = b; B = v;

      case 4: R = c; G = a; B = v;

      case 5: R = v; G = a; B = b;

由算法,写JAVA实现

public static HSV RGB2HSV(RGB rgb){    float r = (float)rgb.getR()/255;    float g = (float)rgb.getG()/255;    float b = (float)rgb.getB()/255;    float max = max(r, g, b);    float min = min(r, g, b);    float h = 0;    if(r==max)     h = (g-b)/(max-min);    if(g==max)     h = 2+(b-r)/(max-min);    if(b==max)     h= 4+(r-g)/(max-min);    h *=60;    if(h<0) h +=360;    HSV hsv = new HSV(h,(max-min)/max,max);    return hsv;   }

对于肤色识别 饱和度(S)和亮度(V)就无关紧要了,这样只需得到一个色调(H)的取值范围。

从网上找了找H的取值范围,大概在25~50,为了近一步确定这个数值,做了如下实验。

先扣了一些美女图,只要肉,尽量选择有差异的。

JAVA图像识别——HSV肤色提取

JAVA实现统计

public static int[] vessel = new int[360];   public static int[] vesselIndex = new int[360];      public static void main(String[] args) throws IOException {    File file = new File("D:\\培养材料");       File[] listFiles = file.listFiles();    ArrayList<HSV> list = new ArrayList<HSV>();    for (int i = 0; i < listFiles.length; i++) {     transition(listFiles[i]);    }       for (int i = 0; i < vesselIndex.length; i++) {     vesselIndex[i] = i;    }    for (int i = 0; i < vessel.length; i++) {     for (int j = i+1; j < vessel.length; j++) {      if(vessel[i]<vessel[j]){       int temp = vessel[i];       vessel[i] = vessel[j];       vessel[j] = temp;       int tempIndex = vesselIndex[i];       vesselIndex[i] = vesselIndex[j];       vesselIndex[j] = tempIndex;      }     }    }    for (int i = 0; i < vesselIndex.length; i++) {     System.out.println("H="+vesselIndex[i]+",count:"+vessel[i]);    }   }      private static ArrayList<HSV> transition(File file) throws IOException{    System.out.println(file.getName());    BufferedImage img = ImageIO.read(file);    ArrayList<HSV> list = new ArrayList<HSV>();    for (int j = 0; j <img.getWidth(); j++) {     for (int j2 = 0; j2 < img.getHeight(); j2++) {      int binaryColor = img.getRGB(j, j2);      if(binaryColor==16777215) continue;      Color c = new Color(binaryColor);      RGB rgb = new RGB(c.getRed(), c.getGreen(), c.getBlue());      HSV hsv = ColorUtils.RGB2HSV(rgb);      if(!"NaN".equals(String.valueOf(hsv.getH())))       vessel[(int)hsv.getH()]++;      list.add(hsv);      System.out.println(hsv);     }         }    return list;   }

 

结果:(略掉count=0)

H=15,count:31071

H=18,count:26936

H=16,count:24615

H=13,count:24031

H=17,count:21968

H=12,count:21211

H=30,count:19438

H=38,count:16740

H=14,count:16470

H=33,count:16404

H=32,count:16217

H=28,count:15231

H=35,count:14929

H=20,count:14714

H=31,count:14353

H=36,count:13654

H=29,count:13515

H=21,count:13311

H=34,count:13133

H=19,count:12595

H=26,count:11921

H=10,count:11062

H=37,count:10669

H=11,count:10422

H=27,count:9726

H=22,count:9010

H=25,count:8629

H=24,count:8548

H=40,count:8375

H=23,count:8240

H=39,count:7295

H=41,count:4262

H=43,count:3365

H=0,count:3229

H=9,count:2628

H=60,count:1983

H=42,count:1469

H=8,count:1453

H=7,count:927

H=44,count:862

H=45,count:742

H=180,count:515

H=51,count:354

H=48,count:263

H=240,count:221

H=330,count:210

H=6,count:198

H=47,count:168

H=50,count:147

H=56,count:137

H=5,count:134

H=63,count:125

H=52,count:116

H=46,count:90

H=69,count:69

H=220,count:59

H=76,count:57

H=70,count:50

H=77,count:44

H=4,count:41

H=64,count:36

H=184,count:32

H=75,count:32

H=72,count:30

H=49,count:29

H=354,count:27

H=353,count:26

H=280,count:25

H=2,count:25

H=150,count:24

H=120,count:23

H=68,count:23

H=352,count:19

H=350,count:17

H=3,count:16

H=55,count:15

H=54,count:14

H=90,count:13

H=65,count:12

H=79,count:11

H=357,count:11

H=210,count:10

H=351,count:10

H=251,count:10

H=74,count:9

H=356,count:9

H=53,count:9

H=190,count:8

H=67,count:8

H=300,count:8

H=73,count:8

H=348,count:8

H=57,count:8

H=185,count:7

H=345,count:7

H=83,count:7

H=78,count:7

H=66,count:7

H=355,count:6

H=188,count:6

H=228,count:6

H=100,count:5

H=340,count:5

H=336,count:4

H=85,count:4

H=84,count:4

H=171,count:3

H=186,count:3

H=173,count:3

H=140,count:3

H=195,count:3

H=349,count:3

H=105,count:3

H=108,count:2

H=174,count:2

H=96,count:2

H=182,count:2

H=183,count:2

H=82,count:2

H=95,count:2

H=165,count:2

H=170,count:2

H=189,count:2

H=106,count:2

H=358,count:2

H=260,count:1

H=264,count:1

H=94,count:1

H=144,count:1

H=88,count:1

H=1,count:1

H=166,count:1

H=342,count:1

H=187,count:1

H=168,count:1

H=110,count:1

H=114,count:1

H=192,count:1

H=172,count:1

H=92,count:1

H=128,count:1

H=175,count:1

H=176,count:1

H=249,count:1

H=135,count:1


分析数据,H的范围大概在9~43之间

验证以上分析

public static void main(String[] args) throws IOException {

  BufferedImage dst = new BufferedImage(100, 360 * 5,

    BufferedImage.TYPE_INT_RGB);

  for (int i = 0; i < 100; i++) {

   //for (int j = 0; j < 360 * 5; j++) {

   for (int j = 0; j < 50 * 5; j++) {

    dst.setRGB(i, j, ColorUtils.RGB2Binary(ColorUtils.HSV2RGB(new HSV(j/5, 1, 1))));

   }

  }

  ImageIO.write(dst, "jpg", new File("D:\\hsv1.jpg"));

 }

结果 (略掉未绘制部分)

JAVA图像识别——HSV肤色提取


H范围[0,50),很显示以上数据,上下可以再切掉10%~30%。这是当S,V都等于1时的图像,尝试修改S和V的值,范围在[0,1],就可以匹配到因光线等问题,造成的较亮或较暗的图像。而在做肤色匹配时,不考虑S和V,使准确性提高。 

判断鲜肉

public static boolean isFlesh2(Color c){
  RGB rgb = new RGB(c.getRed(),c.getGreen(),c.getBlue());
  HSV hsv = ColorUtils.RGB2HSV(rgb);
  if(hsv.getH()>9&&hsv.getH()<43){
   return true;
  }
  return false;
 }

 来自:http://my.oschina.net/u/1422723/blog/408114