处理hadoop发送的文件到后台并解析存储到数据库策略

程序员文章站 2022-04-15 12:12:57

...

主要实现：首先 hadoop mapreduce 处理好的文件，一个个放到指定的文件目录下，然后通过在Linux 下通过定时任务打包发到 web 服务器的指定目录下，然后web 服务器会通过定时任务去解析它，然后，存储导数据库。

1.上篇介绍了文件的解压，通过解压后文件会形成多个文件。
处理hadoop发送的文件到后台并解析存储到数据库策略

如图，解压后，我们会发现有很多文件，然后我们该去对每个文件读取内容并存到数据库中。

2. map 为所有文件解析类

dataMap 所有数据类所有文件的数据都存储到datamap 中了

for (File subfile : subFiles){
	AbstractFileParser ifp = map.get(subfile.getName());
	if (ifp != null) {
		try {
			ifp = ifp.getClass().newInstance();
			ifp.init(subfile, (StatMap) dataMap.get(subfile.getName()));
			jobList.add(ifp);
			ifp.start();
		} catch (Exception e) { e.printStackTrace(); }
	}
}
for (Thread ifp : jobList)
{
	try {
		ifp.join();
	} catch (InterruptedException e) { e.printStackTrace(); }
}

AbstractFileParser 类

BufferedReader bufferedReader = null;
try
{
	bufferedReader = new BufferedReader(new FileReader(this.file));
	String s = null;
	while ((s = bufferedReader.readLine()) != null)
	{
		if (isDebug || logger.isDebugEnabled())
			logger.debug(s);
		String[] ss = s.split(",");
		StatBase o = parseLine(ss);
		if (o != null)
		{
			StatBase b = null;
			synchronized (map)
			{
				b = map.get(o.getPrivateKey());
				if (b == null)
				{
					map.put(o.getPrivateKey(), o);
				}
				else
				{
					update(o, b);
				}
			}
		}
	}
}
catch (Exception e)
{
	logger.error("", e);
}
finally
{
	if (bufferedReader != null)
		try
		{
			bufferedReader.close();
		}
		catch (IOException e)
		{
		}
}

保存到 datamap 中的数据要进行数据库保存