程序卡在pthread_join()

lisong871121 2009-11-05 02:15:10
我有一个主线程通过命令来创建和关闭多个子线程,但是不会超过32个,所以系统资源是肯定够得!具体步骤是这样

收到创建线程的命令,创建线程,线程时不断循环执行任务的,每次循环前检查标记flag[n](flag[n]为整形数组,用来标记每个子线程是否需要结束)是否为1,如果不为1则自己结束。

收到关闭线程的命令,通过将标记flag[n]置为0,然后调用pthread_join()来等待该线程结束,知道该线程结束后在执行新的命令。运行一段时间后程序就卡在pthread_join()这里了。谁知道怎么回事。
...全文
2034 14 打赏 收藏 转发到动态 举报
写回复
用AI写文章
14 条回复
切换为时间正序
请发表友善的回复…
发表回复
muziaimugua 2012-09-29
  • 打赏
  • 举报
回复
我也遇到相同的问题,楼主是否有时间交流一下,qq:741376209
lisong871121 2009-11-06
  • 打赏
  • 举报
回复
cmd函数不会重入的哦。。。。
lvyinghong 2009-11-06
  • 打赏
  • 举报
回复
你的cmd 函数不回重入的吧?
不过个人觉得以毫秒级别,不停到创建和退出线程总是不合理的吧。
lisong871121 2009-11-06
  • 打赏
  • 举报
回复
我用了标记啊,通过将标记置为0,让线程号为n的现成自己结束。接着主线程用pthread_join应该能得到返回在对呢
lisong871121 2009-11-06
  • 打赏
  • 举报
回复
我改了下,不传地址。直接传值,写成pthread_create(........, (void*)n); 然后线程函数写成
handl(int n)就解决问题了。难得11楼看得这么仔细分全给了
lisong871121 2009-11-06
  • 打赏
  • 举报
回复
感谢楼上,我也刚找出来这个问题!刚准备结贴发现了你的答案。非常感谢
lvyinghong 2009-11-06
  • 打赏
  • 举报
回复
看出来了,你那个代码应该不会,会不会是传进来的
void *handl( int *n) 的n的问题, 因为你不同线程的 n都是同一个buffer里面的,
你在 handl 的开头打印一下 n指向的地址,看看是不是不同线程用到都是同一个地址的数据。

如果是这样,就有可能导致子线程运行到 int m = *n 之前,主线程又已经修改了 n中到数据,m得到的不是对应到值,
dongjiawei316 2009-11-05
  • 打赏
  • 举报
回复
pthread_join并不能结束某一个线程,而是等待一个线程的结束。而你的线程并没结束,所以他一直等待下去,
就阻塞住了

你要想结束一个线程,该用pthread_cancel
lisong871121 2009-11-05
  • 打赏
  • 举报
回复
谢谢大家,有点想法了,我在仔细看看
HULIHONG 2009-11-05
  • 打赏
  • 举报
回复
可以用条件变量和pthread_cancel试试
pottichu 2009-11-05
  • 打赏
  • 举报
回复
你的线程里是否会有阻塞调用?
如果有 现 pthread_cancel 一下。

另外你会不会 join 到不存在的线程 id ?
zkuang82 2009-11-05
  • 打赏
  • 举报
回复
你看那看有没有同一个thread被多次join的情况。如果有,行为是不确定的。
lisong871121 2009-11-05
  • 打赏
  • 举报
回复
程序太多,我大概写下伪代码吧
int flag[32]; //全局变量
pthread_t thread_id[32]; //全局变量

int main()
{
............
char* str[];
char *recv;
while(1)
{
recv(..., recv, ......);//根据buf来决定创建或者关闭子线程
//接收到的信息可能包含多条命令,将这些命令分割开并且存储到
//字符串数组str[]中

cmd(str); //调用命令处理函数
}

}

void cmd( char * str[])
{
int i =0;
while(str[i] != NULL)//分处理每个命令
{
buf = str[i]
if(buf == 创建线程) //buf里有个号码,n
{
flag[n] = 1;
pthread_create(&thread_id[n],.........., (void*)handl, n)
}
else if(buf == 关闭线程)
{
flag[n] = 0;
pthread_join(thread_in[n], NULL);
}
i++;
}
}


void *handl( int *n)
{
int m = *n
while(flag[m])
{
.......
}
pthread_exit(NULL);
}

如果我每次发送的命令格式为 《创建5个线程 关闭5个线程 创建5个线程》循环发送这样的命令,如果速度很快,比如1ms发一次就会出现程序卡在pthread_join()那个地方,发送慢点程序正常,谁能解释下么
zkuang82 2009-11-05
  • 打赏
  • 举报
回复
似乎需要贴一下程序吧,就这样说看不出问题。
同步概念 所谓同步,即同时起步,协调一致。不同的对象,对“同步”的理解方式略有不同。如,设备同步,是指在两个设备之间规定一个共同的时间参考;数据库同步,是指让两个或多个数据库内容保持一致,或者按需要部分保持一致;文件同步,是指让两个或多个文件夹里的文件保持一致。等等 而,编程中、通信中所说的同步与生活中大家印象中的同步概念略有差异。“同”字应是指协同、协助、互相配合。主旨在协同步调,按预定的先后次序运行。 线程同步 同步即协同步调,按预定的先后次序运行。 线程同步,指一个线程发出某一功能调用时,在没有得到结果之前,该调用不返回。同时其它线程为保证数据一致性,不能调用该功能。 举例1: 银行存款 5000。柜台,折:取3000;提款机,:取 3000。剩余:2000 举例2: 内存中100字节,线程T1欲填入全1, 线程T2欲填入全0。但如果T1执行了50个字节失去cpu,T2执行,会将T1写过的内容覆盖。当T1再次获得cpu继续 从失去cpu的位置向后写入1,当执行结束,内存中的100字节,既不是全1,也不是全0。 产生的现象叫做“与时间有关的错误”(time related)。为了避免这种数据混乱,线程需要同步。 “同步”的目的,是为了避免数据混乱,解决与时间有关的错误。实际上,不仅线程间需要同步,进程间、信号间等等都需要同步机制。 因此,所有“多个控制流,共同操作一个共享资源”的情况,都需要同步。 数据混乱原因: 1. 资源共享(独享资源则不会) 2. 调度随机(意味着数据访问会出现竞争) 3. 线程间缺乏必要的同步机制。 以上3点中,前两点不能改变,欲提高效率,传递数据,资源必须共享。只要共享资源,就一定会出现竞争。只要存在竞争关系,数据就很容易出现混乱。 所以只能从第三点着手解决。使多个线程在访问共享资源的时候,出现互斥。 互斥量mutex Linux中提供一把互斥锁mutex(也称之为互斥量)。 每个线程在对资源操作前都尝试先加锁,成功加锁才能操作,操作结束解锁。 资源还是共享的,线程间也还是竞争的, 但通过“锁”就将资源的访问变成互斥操作,而后与时间有关的错误也不会再产生了。 但,应注意:同一时刻,只能有一个线程持有该锁。 当A线程对某个全局变量加锁访问,B在访问前尝试加锁,拿不到锁,B阻塞。C线程不去加锁,而直接访问该全局变量,依然能够访问,但会出现数据混乱。 所以,互斥锁实质上是操作系统提供的一把“建议锁”(又称“协同锁”),建议程序中有多线程访问共享资源的时候使用该机制。但,并没有强制限定。 因此,即使有了mutex,如果有线程不按规则来访问数据,依然会造成数据混乱。 主要应用函数: pthread_mutex_init函数 pthread_mutex_destroy函数 pthread_mutex_lock函数 pthread_mutex_trylock函数 pthread_mutex_unlock函数 以上5个函数的返回值都是:成功返回0, 失败返回错误号。 pthread_mutex_t 类型,其本质是一个结构体。为简化理解,应用时可忽略其实现细节,简单当成整数看待。 pthread_mutex_t mutex; 变量mutex只有两种取值1、0。 pthread_mutex_init函数 初始化一个互斥锁(互斥量) ---> 初值可看作1 int pthread_mutex_init(pthread_mutex_t *restrict mutex, const pthread_mutexattr_t *restrict attr); 参1:传出参数,调用时应传 &mutex restrict关键字:只用于限制指针,告诉编译器,所有修改该指针指向内存中内容的操作,只能通过本指针完成。不能通过除本指针以外的其他变量或指针修改 参2:互斥量属性。是一个传入参数,通常传NULL,选用默认属性(线程间共享)。 参APUE.12.4同步属性 1. 静态初始化:如果互斥锁 mutex 是静态分配的(定义在全局,或加了static关键字修饰),可以直接使用宏进行初始化。e.g. pthead_mutex_t muetx = PTHREAD_MUTEX_INITIALIZER; 2. 动态初始化:局部变量应采用动态初始化。e.g. pthread_mutex_init(&mutex, NULL) pthread_mutex_destroy函数 销毁一个互斥锁 int pthread_mutex_destroy(pthread_mutex_t *mutex); pthread_mutex_lock函数 加锁。可理解为将mutex--(或-1) int pthread_mutex_lock(pthread_mutex_t *mutex); pthread_mutex_unlock函数 解锁。可理解为将mutex ++(或+1) int pthread_mutex_unlock(pthread_mutex_t *mutex); pthread_mutex_trylock函数 尝试加锁 int pthread_mutex_trylock(pthread_mutex_t *mutex); 加锁与解锁 lock与unlock: lock尝试加锁,如果加锁不成功,线程阻塞,阻塞到持有该互斥量的其他线程解锁为止。 unlock主动解锁函数,同时将阻塞在该锁上的所有线程全部唤醒,至于哪个线程先被唤醒,取决于优先级、调度。默认:先阻塞、先唤醒。 例如:T1 T2 T3 T4 使用一把mutex锁。T1加锁成功,其他线程均阻塞,直至T1解锁。T1解锁后,T2 T3 T4均被唤醒,并自动再次尝试加锁。 可假想mutex锁 init成功初值为1。 lock 功能是将mutex--。 unlock将mutex++ lock与trylock: lock加锁失败会阻塞,等待锁释放。 trylock加锁失败直接返回错误号(如:EBUSY),不阻塞。 加锁步骤测试: 看如下程序:该程序是非常典型的,由于共享、竞争而没有加任何同步机制,导致产生于时间有关的错误,造成数据混乱: #include #include #include void *tfn(void *arg) { srand(time(NULL)); while (1) { printf("hello "); sleep(rand() % 3); /*模拟长时间操作共享资源,导致cpu易主,产生与时间有关的错误*/ printf("world\n"); sleep(rand() % 3); } return NULL; } int main(void) { pthread_t tid; srand(time(NULL)); pthread_create(&tid, NULL, tfn, NULL); while (1) { printf("HELLO "); sleep(rand() % 3); printf("WORLD\n"); sleep(rand() % 3); } pthread_join(tid, NULL); return 0; } 【mutex.c】 【练习】:修改该程序,使用mutex互斥锁进行同步。 1. 定义全局互斥量,初始化init(&m, NULL)互斥量,添加对应的destry 2. 两个线程while中,两次printf前后,分别加lock和unlock 3. 将unlock挪至第二个sleep后,发现交替现象很难出现。 线程在操作完共享资源后本应该立即解锁,但修改后,线程抱着锁睡眠。睡醒解锁后又立即加锁,这两个库函数本身不会阻塞。 所以在这两行代码之间失去cpu的概率很小。因此,另外一个线程很难得到加锁的机会。 4. main 中加flag = 5 将flg在while中-- 这时,主线程输出5次后试图销毁锁,但子线程未将锁释放,无法完成。 5. main 中加pthread_cancel()将子线程取消。 【pthrd_mutex.c】 结论: 在访问共享资源前加锁,访问结束后立即解锁。锁的“粒度”应越小越好。 死锁 1. 线程试图对同一个互斥量A加锁两次。 2. 线程1拥有A锁,请求获得B锁;线程2拥有B锁,请求获得A锁 【作业】:编写程序,实现上述两种死锁现象。 读写锁 与互斥量类似,但读写锁允许更高的并行性。其特性为:写独占,读共享。 读写锁状态: 一把读写锁具备三种状态: 1. 读模式下加锁状态 (读锁) 2. 写模式下加锁状态 (写锁) 3. 不加锁状态 读写锁特性: 1. 读写锁是“写模式加锁”时, 解锁前,所有对该锁加锁的线程都会被阻塞。 2. 读写锁是“读模式加锁”时, 如果线程以读模式对其加锁会成功;如果线程以写模式加锁会阻塞。 3. 读写锁是“读模式加锁”时, 既有试图以写模式加锁的线程,也有试图以读模式加锁的线程。那么读写锁会阻塞随后的读模式锁请求。优先满足写模式锁。读锁、写锁并行阻塞,写锁优先级高 读写锁也叫共享-独占锁。当读写锁以读模式锁住时,它是以共享模式锁住的;当它以写模式锁住时,它是以独占模式锁住的。写独占、读共享。 读写锁非常适合于对数据结构读的次数远大于写的情况。 主要应用函数: pthread_rwlock_init函数 pthread_rwlock_destroy函数 pthread_rwlock_rdlock函数 pthread_rwlock_wrlock函数 pthread_rwlock_tryrdlock函数 pthread_rwlock_trywrlock函数 pthread_rwlock_unlock函数 以上7 个函数的返回值都是:成功返回0, 失败直接返回错误号。 pthread_rwlock_t类型 用于定义一个读写锁变量。 pthread_rwlock_t rwlock; pthread_rwlock_init函数 初始化一把读写锁 int pthread_rwlock_init(pthread_rwlock_t *restrict rwlock, const pthread_rwlockattr_t *restrict attr); 参2:attr表读写锁属性,通常使用默认属性,传NULL即可。 pthread_rwlock_destroy函数 销毁一把读写锁 int pthread_rwlock_destroy(pthread_rwlock_t *rwlock); pthread_rwlock_rdlock函数 以读方式请求读写锁。(常简称为:请求读锁) int pthread_rwlock_rdlock(pthread_rwlock_t *rwlock); pthread_rwlock_wrlock函数 以写方式请求读写锁。(常简称为:请求写锁) int pthread_rwlock_wrlock(pthread_rwlock_t *rwlock); pthread_rwlock_unlock函数 解锁 int pthread_rwlock_unlock(pthread_rwlock_t *rwlock); pthread_rwlock_tryrdlock函数 非阻塞以读方式请求读写锁(非阻塞请求读锁) int pthread_

23,224

社区成员

发帖
与我相关
我的任务
社区描述
Linux/Unix社区 应用程序开发区
社区管理员
  • 应用程序开发区社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧