深入V8引擎-默认Platform之mac篇(2)

程序员文章站 2022-06-22 21:17:18

先说结论，V8引擎在默认Platform中初始化的这个线程是用于处理类似于setTimeout的延时任务。另外附一些图，包括继承树、关键属性归属、纯逻辑工作流程，对代码木得兴趣的看完图可以X掉了。上一篇讲了V8初始化默认Platform对象时会做三件事，其中生成空白DefaultPlatform ......

　　先说结论，v8引擎在默认platform中初始化的这个线程是用于处理类似于settimeout的延时任务。

　　另外附一些图，包括继承树、关键属性归属、纯逻辑工作流程，对代码木得兴趣的看完图可以x掉了。

　　上一篇讲了v8初始化默认platform对象时会做三件事，其中生成空白defaultplatform、获取线程池大小已经讲过了，剩下线程启动相关的内容。

　　写之前花了10几分钟学了下mac下c++的线程，对api有一个初步了解，给一个简单的例子，大概流程如下。

// v8源码中设置的stack_size 在测试demo中不好使
const int stack_size = 1 * 1024 * 512;
int tmp = 0;

// 线程的任务 参数来源于创建时的第四个参数
void* add(void* number){
  tmp = tmp + *(int*)number;
  printf("tmp: %i\n", tmp);
  return nullptr;
};

int main(int argc, const char * argv[]) {
  // 创建线程对象
  pthread_t pt;
  // 创建线程属性
  pthread_attr_t attr;
  memset(&attr, 0, sizeof(attr));
  pthread_attr_init(&attr);
  // 设置属性的size
  pthread_attr_setstacksize(&attr, stack_size);
  // 函数参数
  int num = 5;
  int* ptr = &num;
  // 生成一个线程
  // 参数列表参照各个变量
  int ret = pthread_create(&pt, &attr, add, ptr);
  if(ret != 0) printf("cannot create thread");
  return 0;
}

　　通过几个步骤，就可以创建一条线程来处理任务，启动后的输出就懒得截图了，反正就是打印一个5。

　　有了上面的例子，可以慢慢来看v8初始化时多线程的启动过程，首先是入门方法。

// 3
void defaultplatform::ensurebackgroundtaskrunnerinitialized() {
  // 这里初始化defaultplatform的属性 需要加锁
  base::mutexguard guard(&lock_);
  if (!worker_threads_task_runner_) {
    worker_threads_task_runner_ =
        // 3-2
        std::make_shared<defaultworkerthreadstaskrunner>(
            thread_pool_size_, time_function_for_testing_
                                   ? time_function_for_testing_
                                  // 3-1
                                   : defaulttimefunction);
  }
}

// 3-1
double defaulttimefunction() {
  return base::timeticks::highresolutionnow().tointernalvalue() /
         static_cast<double>(base::time::kmicrosecondspersecond);
}

　　if中的worker_threads_task_runner是defaultplatform的私有属性，由于初始化时默认值为null，这里做一个定义赋值。第一个参数是在第二步获取的线程池大小，第二个参数是一个计数方法，默认引用之前time模块里的东西，返回硬件时间戳，具体实现可以看我之前写的。

　　接下来看defaultworkerthreadstaskrunner类的构造函数，接受2个参数。

// 3-2
// queue_ => delayedtaskqueue::delayedtaskqueue(timefunction time_function) : time_function_(time_function) {}
defaultworkerthreadstaskrunner::defaultworkerthreadstaskrunner(
    uint32_t thread_pool_size, timefunction time_function)
    : queue_(time_function),
      time_function_(time_function),
      thread_pool_size_(thread_pool_size) {
  for (uint32_t i = 0; i < thread_pool_size; ++i) {
    // 3-3
    thread_pool_.push_back(base::make_unique<workerthread>(this));
  }
}

　　用2个参数初始化了3个属性，并且根据size往线程池中添加线程，thread_pool_这个属性用vector在管理，push_back相当于js的push，当成数组来理解就行了。

　　添加的workerthread类是在defaultworkerthreadstaskrunner里面的一个私有内部类，继承于thread，单纯的用来管理线程。c++的this比较简单，没有js那么多概念，就是一个指向当前对象的指针，来看一下线程类的构造函数。

// 3-3
defaultworkerthreadstaskrunner::workerthread::workerthread(defaultworkerthreadstaskrunner* runner)
    // 这里调用父类构造函数
    : thread(options("v8 defaultworkerthreadstaskrunner workerthread")),
    // 这里初始化当前类属性
      runner_(runner) {
  // 3-4
  start();
}

　　这里同时调用了父类构造函数并初始化本身的属性，runner就是上面那个对象本身。这个构造函数长得比较奇怪，其中options类是thread的内部类，有一个接受一个类型为字符串的构造函数，而thread的构造函数只接受options类型，所以会这样，代码如下。

class thread {
 public:
  // opaque data type for thread-local storage keys.
  using localstoragekey = int32_t;

  class options {
   public:
    options() : name_("v8:<unknown>"), stack_size_(0) {}
    explicit options(const char* name, int stack_size = 0)
        : name_(name), stack_size_(stack_size) {}
    // ...
  };

  // create new thread.
  explicit thread(const options& options);
  // ...
}

　　可以简单理解这里给线程取了一个名字，在给options命名的同时，其实也给thread命名了，如下。

thread::thread(const options& options)
    : data_(new platformdata),
      stack_size_(options.stack_size()),
      start_semaphore_(nullptr) {
  if (stack_size_ > 0 && static_cast<size_t>(stack_size_) < pthread_stack_min) {
    stack_size_ = pthread_stack_min;
  }
  set_name(options.name());
}

class thread {
  // the thread name length is limited to 16 based on linux's implementation of
  // prctl().
  static const int kmaxthreadnamelength = 16;
  char name_[kmaxthreadnamelength];
}

void thread::set_name(const char* name) {
  // 这里的长度被限制在16以内
  strncpy(name_, name, sizeof(name_));
  name_[sizeof(name_) - 1] = '\0';
}

　　看注释说，由于linux的prctl方法限制了长度，所以这里的name也最多只能保存16位，而且c++的字符串的最后一位还要留给结束符，所以理论上传入options的超长字符串

"v8 defaultworkerthreadstaskrunner workerthread"只有前15位作为thread的name保存下来了，也就是"v8 defaultworke"，非常戏剧性的把r给砍掉了。。。

　　初始化完成后，会调用start方法启动线程，这个方法并不需要子类实现，而是基类已经定义好了，保留关键代码如下。

// 3-4
void thread::start() {
  int result;
  // 线程对象
  pthread_attr_t attr;
  memset(&attr, 0, sizeof(attr));
  // 初始化线程对象
  result = pthread_attr_init(&attr);
  size_t stack_size = stack_size_;
  if (stack_size == 0) {
    stack_size = 1 * 1024 * 1024;
  }
  if (stack_size > 0) {
    // 设置线程对象属性
    result = pthread_attr_setstacksize(&attr, stack_size);
  }
  {
    // 创建一个新线程
    // 3-5
    result = pthread_create(&data_->thread_, &attr, threadentry, this);
  }
  // 摧毁线程对象
  result = pthread_attr_destroy(&attr);
}

　　参照一下文章开始的demo，可以看出去掉了合法性检测和宏之后，在初始化和启动线程基本上v8的形式是一样的。

　　简单总结一下，v8初始化了一个defaultplatform类，计算了一下可用线程池大小，生成了几条线程弄进线程池，而每条线程的任务就是那个threadentry，这篇全部写完算了。

　　这个方法贼麻烦。

// 3-5
static void* threadentry(void* arg) {
  thread* thread = reinterpret_cast<thread*>(arg);
  // we take the lock here to make sure that pthread_create finished first since
  // we don't know which thread will run first (the original thread or the new
  // one).
  { mutexguard lock_guard(&thread->data()->thread_creation_mutex_); }
  // 3-6
  setthreadname(thread->name());
  // 3-7
  thread->notifystartedandrun();
  return nullptr;
}

　　由于线程任务的参数定义与返回值都是void*，这里直接做一个强转。随后会加一个线程锁，因为这几个线程在初始化的时候并不需要同时执行这个任务。执行的第一个方法虽然从名字来看只是简单的给线程设置名字，但是内容却不简单。　　

　　传入setthreadname方法的参数是之前那个被截断的字符串，看一下这个方法。

// 3-6
static void setthreadname(const char* name) {
  // pthread_setname_np is only available in 10.6 or later, so test
  // for it at runtime.
  int (*dynamic_pthread_setname_np)(const char*);
  // 读取动态链接库
  *reinterpret_cast<void**>(&dynamic_pthread_setname_np) =
    dlsym(rtld_default, "pthread_setname_np");
  if (dynamic_pthread_setname_np == nullptr) return;

  // mac os x does not expose the length limit of the name, so hardcode it.
  static const int kmaxnamelength = 63;
  // 从读取到的方法处理name
  dynamic_pthread_setname_np(name);
}

　　里面用了一个很玄的api的叫dlsym，官方解释如下。

the function dlsym() takes a "handle" of a dynamic library returned by dlopen() and the null-terminated symbol name, returning the address where that symbol is loaded into memory.

　　大概就是根据句柄读取一个动态链接库，名字就是那个字符串，返回其在内存中的地址，所以这块的调试全是机器码，根本看不懂，最后返回的一个函数。深入V8引擎-默认Platform之mac篇(2)

　　知道这是个函数就行了，至于怎么设置线程名字我也不太想知道。

　　第二步的方法名就是运行线程的任务，调用链比较长，会来回在几个类之间穿梭，调用各自属性的方法。

// 3-7
void notifystartedandrun() {
  if (start_semaphore_) start_semaphore_->signal();
  // 3-8
  run();
}

// 3-8
void defaultworkerthreadstaskrunner::workerthread::run() {
  runner_->single_worker_thread_id_.store(base::os::getcurrentthreadid(), std::memory_order_relaxed);
  // 3-9
  while (std::unique_ptr<task> task = runner_->getnext()) {
    // 每一个task会实现自己的run函数
    task->run();
  }
}

// 3-9
std::unique_ptr<task> defaultworkerthreadstaskrunner::getnext() {
  // 3-10
  return queue_.getnext();
}

　　不理清楚，这个地方真的很麻烦，绕得很，可以看顶部的继承图。总之，最后调用的是defaultworkerthreadstaskrunner类上一个类型为delayedtaskqueue类的getnext方法，返回类型是task类，v8只是简单定义了一个基类，实际运行时的所以task都需要继承这个类并实现其run方法以便线程执行。

　　最后的最后，getnext的逻辑其实可以参考libuv的逻辑，机制都大同小异，方法的源码如下。

// 3-10
std::unique_ptr<task> delayedtaskqueue::getnext() {
  base::mutexguard guard(&lock_);
  for (;;) {
    /**
     * 这一片内容完全可以参考libuv事件轮询的前两步
     * 1、从delayqueue队列中依次取出超过指定时间的task
     * 2、将所有超时的task放到task_queue_队列中
     * 3、从task_queue_中将task依次取出并返回
     * 4、外部会调用task的run方法并重复调用该函数
    */
    double now = monotonicallyincreasingtime();
    std::unique_ptr<task> task = poptaskfromdelayedqueue(now);
    while (task) {
      task_queue_.push(std::move(task));
      task = poptaskfromdelayedqueue(now);
    }
    if (!task_queue_.empty()) {
      std::unique_ptr<task> result = std::move(task_queue_.front());
      task_queue_.pop();
      return result;
    }

    if (terminated_) {
      queues_condition_var_.notifyall();
      return nullptr;
    }
    /**
     * 1、当task_queue_队列没有task需要处理 但是delay_task_queue_有待处理task
     * 这里会计算当前队列中延迟task中最近的触发时间 等待对应的时间再次触发
     * 2、当两个队列都没有需要的事件
     * 线程会直接休眠等待唤醒
    */
    if (task_queue_.empty() && !delayed_task_queue_.empty()) {
      double wait_in_seconds = delayed_task_queue_.begin()->first - now;
      base::timedelta wait_delta = base::timedelta::frommicroseconds(base::timeconstants::kmicrosecondspersecond * wait_in_seconds);

      bool notified = queues_condition_var_.waitfor(&lock_, wait_delta);
      use(notified);
    } else {
      queues_condition_var_.wait(&lock_);
    }
  }
}

　　哎……v8引擎不过如此。

上一篇：罗永浩吐槽微信广告：封面图与实际内容不符

下一篇： Tornado集成Apscheduler定时任务

深入V8引擎-默认Platform之mac篇(2)

深入V8引擎-Time核心方法之mac篇